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A language that doesn’t affect the way you think about programming is 
not worth knowing. 


一 Alan Perlis 
Rust 简 介 


Rust 是 一 门 新 的 编程 语言 。 


我 想 ， 大 部 分 读者 看 到 本 书 ， 估 计 都 会 不 约 而 同 地 想到 同样 的 问 
题 ， 现 存 的 编程 语言 已 经 多 得 数 不 清 了 ， 再 发 明 一 种 新 的 编程 语言 有 何 
意义 ? 难道 现存 的 那么 多 编程 语言 还 不 够 用 吗 ， 发 明 一 种 新 的 编程 语言 
能 解决 什么 新 问题 ? 


俗话 说 ， 工 欲 善 其 事 ， 必 先 利 其 器 。 在 程序 员 平 时 最 常用 的 工具 排 
行 榜 中 ， 编 程 语言 当仁不让 的 是 最 重要 的 “器 ”。 编 程 语 言 不 仅 是 给 程序 
设计 者 使 用 的 工具 ， 反 过 来 ， 它 也 深刻 地 影响 了 设计 者 本 身 的 思维 方式 
和 开发 习惯 。 




















早 越 的 编程 语言 ， 可 以 将 优秀 的 设计 、 先 进 的 思想 、 成 功 的 经 验 ， 
目 然 而 然 地 融入 其 中 ， 使 更 多 的 使 用 者 开阔 眼界 、 拓 展 思 路 ， 受 益 无 


A programming language is a tool that has profound influence on our 
thinking habits. 


一 一 Edsger Dijkstra 


所 以 说 关于 这 个 问题 ， 我 认为 ， 如 果 与 现 有 的 各 种 语言 相 比 ， 新 设 
计 的 语言 有 所 进步 、 有 所 发 展 、 有 所 创新 ， 那 么 它 的 出 现 束 很 有 意义 。 


最 近 这 些 年 ， 的 确 涌现 出 了 一 大 批 编 程 语言 ， 可 以 说 是 百花 争 艳 、 
索 华 似 锅 。 但 是 在 表面 的 楷 案 之 下 ， 我 们 是 否 可 以 自满 地 说 ， 纺 程 语言 
的 设计 和 发 展 已 经 基本 成 熟 、 趋 于 完美 了 呢 ? 丸 怕 不 尽 然 吧 ! 








那些 优秀 的 编程 语言 中 ， 不 少 都 有 目 己 的 “绝活 ”。 有 的 性 能 非常 
， 有 的 表达 力 非常 强 ， 有 的 擅长 组 织 大 型 程序 ， 有 的 适合 小 巧 的 肢 
， 有 的 专注 于 并 及 ， 有 的 偏重 于 科学 计算 ， 等 等 ， 不 一 而 足 。 即 便 如 
， 新 兴 的 Rust 语 言 面 市 后 依旧 展现 出 了 它 的 独特 魅力 ， 矫 筑 不 群 ， 非 
剃 值得 大 家 关注 。 


作为 多 年 来 鲜 有 的 新 一 代 系 统 编程 语言 ， 它 的 设计 准则 是 “安全 ， 
并 及， 实用 ”。Rnust 的 设计 者 是 这 样 定位 这 门 语言 的 : 














亚 医 讨 囊 





Rust is a system’s programming language that runs blazingly fast， 
prevents segfaults, and guarantees thread safety. 


安全 


是 的 ， 安 全 性 很 重要 。Rust 最 重要 的 特点 就 是 可 以 提供 内 存 安全 保 
证 ， 而 且 没 有 额外 的 性 能 损失 。 


在 传统 的 系统 级 编程 语言 〈《C/C++) 的 开发 过 程 中 ， 经 常 出 现 因 各 
种 内 存 错误 引起 的 骨 溃 或 bug。 比 如 空 指针 、 野 指针 、 内 存 泄漏 、 内 存 
越界 、 段 错误 、 数 据 竞 争 、 友 代 融 失效 等 ， 血 泪 斑斑 ， 数 不 胜 数 。 这 些 
问题 不 仅 在 教科 书 中 被 无 数 次 提起 ， 而 且 在 实践 中 也 极其 第 见 。 因 此 ， 
各 种 高 手 辛苦 地 总 结 了 大 量 的 编程 经 验 ， 许 多 代码 检查 和 调试 工具 被 开 
发 出 来 ， 各 种 代码 开发 流程 和 规范 被 制定 出 来 ， 无 数 人 哎 心 沥 血 就 是 为 
了 系统 性 地 防止 各 类 bug 的 出 现 。 尽 管 如 此 ， 我 们 依然 无 法 彻底 解决 这 


些 问题 。 


教科 书 解 决 不 了 问题 ， 因 为 教育 不 是 强制 性 的 ;静态 代码 检查 工具 
解决 不 了 问题 ， 因 为 传统 的 C/C++ 对 静态 代码 检查 不 友好 ， 永 远 只 能 查 
出 一 部 分 问题 ， 软 件 工程 解决 不 了 问题 ， 因 为 规范 依赖 于 执行 者 的 素 
质 ， 任 何人 都 会 犯错 误 。 事 后 debug 也 不 是 办 法 ， 解 决 bug 的 代价 更 高 。 


鉴于 手动 内 存 管理 非常 容易 出 问题 ， 因 此 先 奉 们 发 明了 一 种 自动 垃 
圾 回收 的 机 制 (Garbage Collection) ， 故 而 程序 员 在 绝 大 多 数 情况 下 不 
用 再 操心 内 存 释 放 的 问题 。 新 发 明 的 绝 大 多 数 编 程 语言 都 使 用 了 基于 各 
种 高 级 算法 的 自动 垃圾 回收 机 制 ， 因 为 它 确实 方便 ， 解 放 了 程序 员 的 大 
脑 ， 使 大 家 能 更 专注 于 业务 逻辑 的 部 分 。 但 是 到 目前 为 止 ， 不管 使 用 哪 
种 算法 的 GC 系统 ， 在 性 能 上 都 要 付出 比较 大 的 代价 。 要 么 需要 较 大 的 
运行 时 占用 较 大 内 存 ， 要 么 需要 和 暂停 整个 程序 ， 要 么 具备 不 确定 性 的 时 














延 。 当 然 ， 在 现实 的 许多 业务 场景 中 ， 这 点 开销 是 微不足道 的 ， 因 此 问 
题 不 大 。 可 是 如 果 在 性 能 敏感 的 领域 ， 这 是 完全 不 可 接受 的 。 


很 遗憾 ， 到 目前 为 止 ， 在 系统 级 编程 语言 中 ， 我 们 依然 被 各 种 内 存 
安全 问题 所 困扰 。 这 些 年 来 ， 许 多 新 的 语言 特性 被 发 明 出 来 ， 许 多 优秀 
的 编程 范式 被 总 结 出 来 ， 许 多 高 质量 的 代码 库 被 开发 出 来 。 但 是 内 存 安 
全 问题 依然 像 一 个 幽灵 一 样 ， 一 直 徘 徊 在 众多 程序 员 的 头顶 ， 无 法 摆 
脱 。 再 多 的 努力 ， 也 只 能 减少 它 出 现 的 机 会 ， 很 难保 证 完整 地 解决 所 这 

















Rust 对 上 自己 的 定位 是 接近 心 片 人 硬件 的 系统 级 编程 语言 ， 因 此 ， 它 不 
可 能 选择 使 用 自动 垃圾 回收 的 机 制 来 解决 问题 。 事 实证 明 ， 要 想 解决 内 
存 安 全 问题 ， 小 修 小 补 是 不 够 的 ， 必 须 搞 清楚 导致 内 存 错误 的 根本 原 
因 ， 从 源头 上 解决 。Rust 就 是 为 此 而 生 的 。Rust 语 言 是 可 以 保证 内 存 安 
全 的 系统 级 编程 语言 。 这 和 古 它 的 独特 的 优势 。 本 书 将 用 大 量 的 篇 幅 详 细 
介绍 “内 存 安全 ”。 


站 有 


在 计算 机 单 核 性 能 越 来 越 接 近 瓶 颈 的 今天 ， 多 核 并 行 成 了 提高 软件 
执行 效率 的 发 展 趋势 。 一 些 编程 语言 已 经 开始 从 语言 层面 文 持 并 改编 
程 ， 把 “并 发 ”的 概念 植 入 到 了 编程 语言 的 血液 中 。 然 而 ， 在 传统 的 系统 
级 编程 语言 中 ， 并 行 代码 很 容易 出 错 ， 而 且 有 些 问题 很 难 复 现 ， 难 以 发 
现 和 解决 问题 ，debug 的 成 本 非常 高 。 线 程 安全 问题 一 直 以 来 都 是 非常 
令 人 头痛 的 问题 。 


Rnust 当 然 也 不 会 在 这 一 重要 领域 落伍 ， 它 也 非常 好 地 文 持 了 并 发 编 
程 。 更 重要 的 是 ， 在 强大 的 内 存 安全 特性 的 支持 下 ，Rust 一 举 解决 了 并 
发 条 件 下 的 数据 竞争 (Data Race) 问题 。 它 从 编译 阶段 就 将 数据 苋 争 解 
决 在 了 萌芽 状态 ， 保 障 了 线程 安全 。 


Rust 在 并 发 方面 还 具有 相当 不 错 的 可 扩展 性 。 所 有 跟 线程 安全 相关 
的 特性 ， 都 不 是 在 编译 器 中 写 死 的 。 用 户 可 以 用 库 的 形式 实现 各 种 高 效 
且 安 全 的 并 发 编程 模型 ， 进 而 充分 利用 多 核 时 代 的 硬件 性 能 。 
实用 


Rust 并 不 只 是 实验 室 中 的 研究 型 产品 ， 它 的 目标 是 解决 目前 软件 行 


























业 中 实 实在 在 的 各 种 问题 。 它 的 实用 性 体现 在 方方面面 。 


Rust 编 译 器 的 后 端 是 基于 著名 的 LLVM 完 成 机 器 码 生 成 和 优化 的 ， 
它 只 需要 一 个 非常 小 巧 的 运行 时 即 可 工作 ， 执 行 效率 上 可 与 C 语 言 相 她 
美 ， 具 备 很 好 的 跨 平 台 特 性 。 


Rust 控 弃 了 手动 内 存 管 理 带 来 的 各 种 不 安全 的 弊端 ， 同 时 也 避免 了 
目 动 垃圾 回收 带 来 的 效率 损失 和 不 可 控 性 。 在 绝 大 部 分 情况 下 ， 保 持 
了 “无 额外 性 能 损失 ”的 抽象 能 


Rust 有 具备 比较 强大 的 类 型 系统 ， 借 鉴 了 许多 现代 编程 语言 的 历史 经 
验 ， 包 含 了 众多 方便 的 语法 特性 。 其 中 包括 代数 类 型 系统 、 模 式 匹 配 、 
闭 包 、 生 成 器 、 类 型 推 亲 、 泛 型 、 与 C 库 ABI 兼 容 、 宏 、 模 块 管理 机 
制 、 内 置 开源 库 发 布 和 管理 机 制 、 支 持 多 种 编程 范式 等 。 它 吸收 了 许多 
其 他 语言 中 优秀 的 抽象 能 力 ， 海 纳 百 川 ， 兼 容 并 著 。 在 不 影响 安全 和 效 
率 的 情况 下 ， 拥 有 不 俗 的 抽象 表达 力 。 


有 意思 的 地 方 是 ， 在 程序 语言 设计 领域 ， 按 照 传 统 思路 ， 有 些 设计 


目标 是 互相 冲突 的 。 而 Rust 的 优 寞 之 处 在 于 ， 它 能 游 力 有 余地 游 走 在 各 
种 设计 目标 之 间 ， 扬 长 避 短 ， 保 持 民 好 的 妥协 和 平衡 。 


本 书 结构 

















本 书 将 详细 描述 Rust 语 言 的 基本 语法 ， 罕 插 讲解 一 部 分 高 级 使 用 技 
巧 ， 并 尽量 以 更 容易 理解 的 方式 同 读 者 解释 其 背后 的 设计 思想 。 语 法 只 
是 基础 ， 并 非 本 书 的 重点 ， 笔 者 更 希望 读者 能 理解 到 这 些 语法 设计 背后 
的 理念 ， 读 完 本 书 之 后 ， 可 以 从 中 受到 一 点 局 有 发， 对 程序 语言 有 更 多 的 
认识 ， 从 而 对 编程 本 身 有 更 深 的 理解 。 








Learning a language that is significantly different than you are used to is 
certainly tough at first，bnut it’s a great way to expand your horizons a bit. 


在 本 书 中 ， 笔 者 尽量 避免 要 求 读者 有 很 多 的 基础 知识 。 当 然 ， 如 果 
读者 对 其 他 的 一 种 或 多 种 编程 语言 有 所 了 解 更 佳 ， 其 中 包括 C/C++ 的 基 
础 知识 、 内 存 错误 、 手 动 内 存 管理 、 自 动 垃圾 回收 、 多 线程 并 发 和 同 
步 、 操 作 系统 相关 的 基础 概念 等。 





第 一 部 分 介绍 Rust 基 本 语法 。 因 为 对 任何 程序 设计 语言 来 说 ， 语 法 
都 是 基础 ， 学 习 这 部 分 是 理解 其 他 部 分 的 前 提 。 


第 二 部 分 介绍 属于 Rust 独 一 无 二 的 内 存 管 理 方式 。 它 设计 了 一 组 全 
新 的 机 制 ， 既 保证 了 安全 性 ， 又 保持 了 强大 的 内 存 布局 控制 力 ， 而 且 没 
有 额外 性 能 损失 。 这 部 分 是 本 书 的 重点 和 核心 所 在 ， 是 Rust 语 言 的 思想 
内 核 精 髓 之 处 。 


第 三 部 分 介绍 Rust 的 抽象 表达 能 力 。 它 文 持 多 种 编程 范式 ， 以 及 较 
为 强大 的 抽象 表达 能 力 。 


第 四 部 分 介绍 并 及 模型 。 在 目前 这 个 阶段 ， 对 并 行 编程 的 支持 是 新 
一 代 编 程 语言 无 法 绕 过 的 重要 话题 。Rust 也 吸收 了 业界 最 新 的 发 展 成 
果 ， 对 并 及 有 民 好 文 持 。 


第 五 部 分 介绍 一 些 实用 设施 。Rust 语 言 有 许多 创新 ， 但 它 绝 不 是 高 
局 在 上 、 孤 芳 自 党 的 类 型 。 设 计 者 们 在 设计 过 程 中 充分 考虑 了 语言 的 工 
程 实 用 性 。 众 多 在 其 他 语言 中 被 证 明 过 的 优秀 实践 被 吸收 了 进来 ， 有 利 
于 提升 实际 工作 效率 。 


为 了 内 容 的 完整 性 ， 本 书 并 没有 严格 按照 知识 点 顺序 组 织 内 容 ， 少 
数 地 方 会 直接 使 用 后 续 章节 中 的 知识 点 。 笔 者 相信 对 读者 来 说 ， 这 不 是 
0 0 
来 理解 。 

















总 结 和 勘误 


在 计算 机 程序 设计 语言 的 领域 中 ， 一 代 又 一 代 的 语言 潮 起 潮 落 ， 其 
兴起 和 衰落 的 节奏 往往 并 非 取决 于 撤 术 本 刁 的 发 展 。 对 于 Rust 这 门 新 出 
现 的 语言 来 说 ， 以 后 究竟 会 有 多 大 的 影响 ， 是 人 否 会 成 为 取代 茶 种 语言 
的 “新 时 代 的 宠儿 ”， 实 在 难以 预测 ， 而 且 坚 无 必要 预测 。 


笔者 认为 ，Rust 语 言 是 最 近 有 二 年 内 系统 级 编程 语言 领域 的 集大成 
者 之 一 。 不 论 其 最 终 发 展 如 何 ， 它 的 许多 设计 思想 和 令 人 惊叹 的 特性 都 
值得 大 家 学 习 。 在 本 人 的 学 习 过 程 中 ， 也 时 常 为 某 些 精彩 的 设计 发 出 由 


























让 的 赞叹 。 


Rust 语 言 是 一 门 优 秀 的 语言 ， 同 时 也 是 门槛 较 高 的 一 门 语言 ， 要 完 
全 掌握 它 不 是 一 件 很 容易 的 事 。 因 此 ， 笔 者 并 不 希望 将 本 书写 成 语言 特 
攻 的 逐 “ 简 单 岁 列 ， 而 更 希望 门 读者 解释 清楚 这 些 语言 特性 育 后 的 设计 
妊 想 。 

所 幸 的 是 ，Rust 语 言 是 完全 开源 的 ， 不 仅 代 码 是 开源 的 ， 而 且 整 个 
设计 过 程 、 思 辩 讨 论 都 是 对 社区 完全 开放 的 。 它 的 许多 非常 有 价值 的 学 
习 资 料 ， 如 同 星星 点 点 ， 散 落 在 各 个 地 方 ， 包 括 官 方 文 档 、 邮 件 列 表 、 
讨论 组 、GitHub、 个 人 博客 等 。 在 学 习 和 写作 的 过 程 中 ， 能 有 过 一 帘 新 
语言 创造 者 们 的 心路 历程 ， 也 是 难得 的 机 缘 。 


要 想 把 Rust 语 言 的 方方面面 讲 好 、 讲 透 ， 实 在 是 一 个 无 比 繁重 的 任 
务 。 动 笔 之 际 ， 方 知 “ 看 人 挑 担 不 吃力 ， 自 家 挑 担 压 断 疹 ”， 城 悍 诚 恐 ， 
战 战 问 殊 ， 生 怕 有 误 人 子弟 之 嫌 。 笔 者 水 平 有 限 ， 如 有 和 错漏， 在 所 难 
免 ， 欢 迎 读者 批评 指正 。 笔 者 将 会 在 GitHub 上 发 布 最 新 的 勘误 列表 ， 网 
址 为 https:/Wgithub.com/F001/rust_book feedback 。 读 者 可 以 在 这 个 项 目 
中 新 建 bug 提 交 间 题 ， 也 可 以 通过 邮件 (rust-lang@qq.com) 与 笔者 联 
系 。 同 时 也 欢迎 读者 关注 微 信 公 众 号 : Rust 编 程 ， 后 面 还 会 发 布 更 多 大 
于 Rust 的 文章 。 
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在 这 一 部 分 中 ， 我 们 将 对 Rust 语 言 的 主要 语法 特性 做 一 个 循序 渐进 
的 介绍 。Rust 语 言 的 基本 语法 特性 并 不 复杂 ， 它 也 并 没有 贫 多 求全 地 挫 
砌 大 量 华而不实 的 语法 特性 。 相 反 ， 它 在 吸收 各 种 优秀 语法 规则 的 同时 
也 做 了 裁 勇 ， 去 苞 存 青 ， 张 凶 有 度 。 








第 1 章 ”与 君 初 相 见 
Rnust 编 程 语言 的 官方 网 站 是 https:/www.rust-lang.org/ 。 在 官网 主页 
上 ， 我 们 可 以 看 到 ， 在 最 显眼 的 位 置 ， 写 者 Rust 语 言 最 重要 的 特点 : 





Rust is a Systems programming language that runs blazingly fast， 
prevents segfaults, and guarantees thread safety. 

Rust 语 言 是 一 门 系统 编程 语言 ， 它 有 三 大 特点 : 运行 快 、 防 止 段 错 
误 、 保 证 线程 安全 。 

系统 级 编程 是 相对 于 应 用 级 编程 而 言 。 一 般 来 说 ， 系 统 级 编程 意味 
着 更 底层 的 位 置 ， 它 更 接近 于 硬件 层次 ， 并 为 上 层 的 应 用 软件 提供 文 
持 。 系 统 级 编程 语言 一 般 具 有 以 下 特点 : 


可 以 在 资源 非常 受 限 的 环境 下 执行 ; 





:运行 时 开销 很 小 ， 非 常 高 效 ; 

-很 小 的 运行 库 ， 甚 至 于 没有 ; 

:可 以 允许 直接 的 内 存 操作 。 

目前 ，C 和 C++ 应 该 是 业界 最 流行 的 系统 编程 语言 。Rust 的 定位 与 
它们 类 似 ， 但 是 增加 了 安全 性 。C 和 C++ 都 是 编译 型 语言 ， 无 须 规模 庞 
大 的 运行 时 (runtime) 文 持 ， 也 没有 自动 内 存 回 收 (Garbage 








Collection ) 机制 |。 
本 章 主 要 对 Rust 做 一 个 简单 的 介绍 ， 和 准备 好 一 些 基 本 概念 以 及 开发 
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1.1 版 本 和 人 发布 哺 略 


Rust 编 程 语言 是 开源 的 ， 编 译 器 的 源码 位 于 https://github.com/rust- 
lang/rust 项 目 中 ， 语 言 设计 和 相关 讨论 位 于 https://github.com/rust- 
langrfcs 项 目 中 。 对 于 想 深 入 研究 这 门 语言 的 读者 来 说 ， 这 是 一 个 非常 
好 的 消 轧 ， 大 家 可 以 通过 研读 开放 的 源 代 码 和 技术 文档 了 解 到 很 多 书本 
上 没有 讲解 过 的 知识 。 任 何 一 个 开发 者 都 可 以 直接 给 这 个 项 目 提 bug， 
或 者 直接 贡献 代码 。Rust 项 目 是 完全 由 开源 社区 管理 和 张 动 的 ， 社 区 的 
氛围 非常 友好 。 


Rust 编 译 器 有 的 版 本 号 采用 了 “语义 化 版 本 写 ”(Semantic Versioning ) 
规划 。 在 这 个 规则 之 下 ， 版 本 格式 为 : 主 厂 本 号 .次 版 本 号 .修订 号 。 版 
本 号 递增 规则 如 下 。 

主 版 本 号 : 当 你 做 了 不 兼容 的 API 修 改 

次 版 本 号 : 当 你 做 了 同 下 兼容 的 功能 性 新 增 

修订 号 : 当 你 做 了 回 下 兼容 的 问题 修正 

Raust 的 第 一 个 正式 版 本 号 是 1.0， 是 2015 年 5 月 发 布 的 。 从 那 以 后 ， 
只 要 版 本 没有 出 现 大 规模 的 不 兼容 的 升级 ， 大 版 本 写 就 一 直 维 持 
在 “1”， 而 次 版 本 号 会 逐步 升级 。Rust 一 般 以 6 个 星期 更 新 一 个 正式 版 本 
的 速度 进行 迭代 。 

为 了 兼顾 更 新 速度 以 及 稳定 性 ，Rust 使 用 了 多 渠道 发 布 的 策略 : 

nightly 版 本 

beta 版 本 

“stable 版 本 

nightly 版 本 是 每 天 在 主 版 本 上 上 自动 创建 出 来 的 版 本 ， 这 个 版 本 上 的 


功能 最 多 ， 更 新 最 快 ， 但 是 茶 些 功能 存在 问题 的 可 能 性 也 更 大 。 因 为 新 
功能 会 首先 在 这 个 版 本 上 开局 ， 供 用 户 试用 。beta 版 本 是 每 阳 一 段 时 

















间 ， 将 一 些 在 nightly 版 本 中 验证 过 的 功能 开放 给 用 户 使 用 。 它 可 以 被 看 
作 stable 版 本 的 “ 预 发布 " 版 本 。 而 stable 版 本 则 是 正式 版 ， 它 每 隔 6 个 星期 
发 布 一 个 新 版 本 ， 一 些 实验 性 质 的 新 功能 在 此 版 本 上 无 法 使 用 。 它 也 是 
最 稳定 、 最 可 靠 的 版 本 。stable 版 本 是 保证 向 前 兼容 的 。 


在 nightly 版 本 中 使 用 试验 性 质 的 功能 ， 必 须 手动 开局 feature gate。 
也 就 是 说 要 在 当前 项 目的 入 口 文 件 中 加 入 一 条 #1! [feature (...name...) ] 
语句 。 人 否则 是 编译 不 过 的 。 等 到 这 个 功能 最 终 被 稳定 了 ， 再 用 新 版 编译 
器 编译 的 时 候 ， 它 会 警告 你 这 个 feature gate 现 在 是 多 余 的 了 ， 可 以 去 掉 
J 


Rust 语 言 相 对 重大 的 设计 ， 必 须 经 过 RFC (Request For Comments ) 
设计 步骤 。 这 个 步骤 主要 是 用 于 讨论 如 何 “ 设 计 ” 语 言 。 这 个 项 目 存在 于 
https://github.com/rust-lang/rfcs 。 所 有 大 功能 必须 先 写 好 设计 文档 ， 讲 清 
楚 设 计 的 目标 、 实 现 方式 、 优 缺点 等 ， 让 整个 社区 参与 讨论 ， 然 后 
由 “核心 组 ”(Core Team) 的 成 员 参 与 定夺 是 否 接 受 这 个 设计 。 笔 者 强 
烈 建议 各 位 读者 多 读 一 下 RFC 文 档 ， 许 多 深层 次 的 设计 思想 问题 可 以 在 
这 个 项 目 中 找到 答案 。 在 Rust 社 区 ， 我 们 不 仅 可 以 看 到 最 终 的 设计 结 
果 ， 还 能 看 到 每 一 步 设计 的 过 程 ， 对 我 们 来 说 非常 有 教育 意义 。 


Rust 语 言 每 个 相对 复杂 一 点 的 新 功能 ， 都 要 经 历 如 下 步 又 才 算 真 正 
稳定 可 用 : 


RFC — Nightly ”Beta ~ Stable 


先 编写 一 份 RFC， 其 中 包括 这 个 功能 的 目的 、 详 细 设 计 方 案 、 优 缺 
点 探讨 等 。 如 果 这 个 RFC 被 接受 了 ， 下 一 步 就 是 在 编译 器 中 实现 这 个 功 
能 ， 在 nightly 版 本 中 开启 。 经 过 几 个 星期 甚至 几 个 月 的 试用 之 后 ， 根 据 
反馈 结果 来 决定 撤销 、 修 改 或 者 接受 这 个 功能 。 如 果 表 现 不 错 ， 它 束 会 
进入 beta 版 本 ， 继 续 过 几 个 星期 后 ， 如 果 确 实 没 发 现 什么 问题 ， 最 终 会 
进入 stable 版 本 。 至 此 ， 这 个 功能 才 会 被 官方 正式 定 为 “稳定 的 ?功能 ， 
在 后 续 版 本 中 要 确保 兼容 性 的 。 


这 个 发 布 策 略 非常 成 功 ， 它 保证 了 新 功能 可 以 持续 、 快 速 地 进入 到 
编译 占 中 。 在 这 个 发 布 泉 略 的 支持 下 ，Rust 语 言 以 及 编译 颖 的 进化 速 硫 
非常 了 不 起 ， 成 功 实践 了 快速 迭代 、 敏 捷 交 付 以 及 重视 用 户 反 馈 的 特 
点 ， 同 时 也 保证 了 核心 设计 的 稳定 性 一 一 用 户 可 以 根据 目 己 的 需要 和 风 
险 仿 好 ， 选 择 合适 的 版 本 。 本 书 假定 读者 安装 的 是 nightly 版 本 ， 因 为 我 















































们 的 目标 是 学 习 ， 目 前 有 许多 重要 的 功能 只 存在 于 nightly 版 本 。 


在 2017 年 下 半年 ，Rust 设 计 组 又 提出 了 一 个 基于 epoch 的 演进 策略 
(后 来 也 被 称 为 edition〉。 它 要 解决 的 问题 是 ， 如 何 让 Rust 更 平稳 地 进 
化 。 比 如 ， 有 时 某 些 新 功能 确实 需要 一 定 程 度 上 破坏 兼容 性 。 为 了 最 大 
化 地 减少 这 些 变动 给 用 户 带 来 的 影响 ，Rust 设 计 组 又 设计 了 一 个 所 谓 的 
edition 的 方案 。 简 单 来 说 就 是 让 Rust 的 兼容 性 保证 是 一 个 有 时 限 的 长 
度 ， 而 不 是 永久 。Rust 设 计 组 很 可 能 会 在 不 久 的 将 来 肥 布 一 个 2018 
edition， 把 之 前 的 版 本 叫 作 2015 edition。 在 这 个 版 本 的 进化 过 程 中 ， 就 
可 以 实施 一 些 不 兼容 的 改变 。 当 然 了 ，Rust 设 计 组 不 会 突然 让 前 一 个 
| 
渡 的 方案 。 


我 们 举 个 例子 。 假 设 我 们 要 添加 一 个 功能 ， 比 如 增加 一 个 关键 字 。 
这 件 事 情 肯定 是 不 兼容 的 改变 ， 因 为 用 户 写 的 代码 中 很 可 能 包含 用 这 个 
关键 字 命名 的 变量 、 函 数 、 类 型 等 ， 直 接 把 这 个 单词 改 成 天 键 字 会 直接 
导致 这 些 遗 留 代码 出 现 编译 错误 。 那 怎么 办 呢 ? 首先 会 在 下 一 个 edition 
中 做 出 警告 ， 提 示 用 户 这 个 单词 已 经 不 适合 作为 变量 名 了 ， 请 用 户 修 
改 。 但 是 这 个 阶段 代码 依然 能 编译 通过 。 然 后 到 再 下 一 个 edition 的 时 
候 ， 这 个 警告 就 会 变 成 真正 的 编译 错误 ， 此 时 这 个 关键 字 就 可 以 真正 局 
用 了 。 先 编译 警告 ， 再 编译 错误 ， 这 个 过 程 可 能 会 持续 好 几 年 ， 所 以 
Rnust 的 稳定 性 还 是 基本 上 有 保证 的 。 毕 竟 ， 如 果 要 维持 百分之百 的 兼容 
性 ，Rust 语 言 就 很 难 再 继续 进化 了 。 如 果 让 极 少 一 部 分 受 影响 的 遗留 代 
码 ， 完 全 锁 死 整个 语言 的 进步 空间 ， 对 于 那些 特别 需要 某 些 新 功能 的 用 
己 来 说 也 是 不 公平 的 。 通 过 这 个 绥 慢 过 渡 的 人 策略 ， 基 本 可 以 让 所 有 Rust 
0 


Rust 的 标准 库 文档 位 于 https://doc.rust-lang.org/std/ 。 学 会 查阅 标准 
库 文 要 ， 是 每 个 Rust 使 用 者 的 必 备 技能 之 一 。 




















1 溉 半 开发 环境 


Rust 编 译 器 的 下 载 和 安装 方法 在 官网 上 有 文档 说 明 ， 点 击 官网 上 的 
Install 链 接 可 以 查看 。Rust 官 方 已 经 提供 了 预 编 译 好 的 编译 器 供 我 们 下 
载 ， 文 持 Windows 平 台 、Linux 平 台 以 及 Mac 平 台 。 但 是 一 般 我 们 不 蛙 独 
下 载 Rust 的 编译 器 ， 而 是 使 用 一 个 叫 rustup 的 工具 安装 Rust 相 关 的 一 整套 
工具 链 ， 包 括 编译 器 、 标 准 库 、cargo 等 。 使 用 这 个 工具 ， 我 们 还 可 以 
轻易 地 更 新 版 本 、 切 换 渠 道 、 多 工具 链 管 理 等 。 


在 官网 上 下 载 rustup-init 程 序 ， 打 开 命 令 行 工具 ， 执 行 这 个 程序 ， 按 
照 提示 选择 合适 的 选项 即 可 。 不 论 在 Windows、Linux 还 是 Mac 操 作 系 统 
上 ， 安 装 步 又 都 是 差不多 的 。 


在 Windows 平 台 下 的 选项 要 稍微 麻烦 一 点 。 在 Windows 平 侣 上 ， 

Rnust 文 持 两 种 形式 的 ABI (Application Binary Interface) ， 一 种 是 原生 的 
MSVC 版 本 ， 另 一 种 是 GNU 版 本 。 如 果 你 需要 跟 MSVC 生 成 的 库 打 区 
道 ， 就 选择 MSVC 版 本 ， 如 果 你 需要 跟 MinGW 生 成 的 库 打 交道 ， 就 选择 
GNU 版 本 。 一 般 情况 下 ， 我 们 选择 MSVC 版 本 。 在 这 种 情况 下 ，Rust 编 
译 器 还 需要 依赖 MSVC 提 供 的 链接 器 ， 因 此 还 需要 下 载 VisualC++ 的 工 
具 链 。 到 Visual Studio 官 网 下 载 VS2015 或 者 VS2017 社 区 版 ， 安 装 C++ 开 
发 工具 即 可 。 


安装 完成 之 后 ， 在 $HOME/.cargo/bin 文 件 夹 下 可 以 看 到 一 系列 的 可 
执行 程序 ， 比 如 Rust 1.19 版 本 的 时 候 ， 在 Windows 平 台 上 安装 的 程序 如 
图 1-1 所 示 。 











| cargo.exe 


cargo-fmt.exe 
| racer.exe 
| ris.exe 
rustCcexe 
| rustdoc.exe 
rustfmt.exe 
| rust-gdb.exe 


| rust-lldb.exe 





| rustup.exe 
图 1-1 


其 中 ，rustc.exe 是 编译 器 ，cargo.exe 是 包 管理 器 ，cargo-fmt.exe 和 
tn exe 是 源 代码 格式 化 工具 ，rust-gdb.exe 和 rust-lldb.exe 是 调试 器 ， 
rustdoc.exe 是 文档 生成 器 ，rls. exe 和 iaaer exe 是 为 编辑 器 准备 的 代码 提示 
工具 ，rustup.exe 是 管理 这 和 套 工 具 链 下 载 更 新 的 工具 。 


我 们 可 以 使 用 rustup 工 具 管 理工 具 链 。 





// 更 新 rustup 本 身 

$ rustup self update 
// 御 载 rust 所 有 程序 

$ rustup self uninstall 
// 更 新 工具 链 

$ rustup update 





























我 们 还 可 以 使 用 它 轻松 地 在 stable/beta/nightly 汇 道中 切换 ， 比 如 : 




















// 安装 nightly 版 本 的 编译 工具 链 
$ rustup install nightly 
// 设置 默认 工具 链 是 night1y 版 本 















































$ rustup default nightly 





为 了 提高 访问 速度 ， 中 国 科 技 大 学 Linux 用 户 协 会 (USTC LUG) 
提供 了 一 个 代理 服务 ， 官 方 网 址 
为 https://lug.ustc.edu.cn/wiki/mirrors/help/rust-static ， 建 议 国 内 用 户 设置 
好 以 下 环境 变量 再 使 用 rustup: 








export RUSTUP_DIST_ SERVER=https://mirrors.ustc.edu.cn/rust-static 
export RUSTUP_UPDATE_ ROOT=https://mirrors.ustc.edu.cn/rust-static/rustup 





Rust 官 方 工 具 链 还 提供 了 重要 的 包 管 理工 具 cargo.exe， 我 们 可 以 通 
过 这 个 工具 轻松 导入 或 者 发 布 开源 库 。 官 方 的 管理 仓库 
在 https://crates.io/ ， 大 家 可 以 登录 这 个 网 站 浏览 一 下 Rust 社 区 热门 的 开 
源 库 都 有 哪些 。 大 型 项 目 往 往 需要 依赖 这 些 开 源 库 ，cargo 会 帮 我 们 自 
动 下 载 编 译 。 同 样 ， 为 了 解决 网 络 问题 ， 需 要 利用 USTC 提 供 的 代理 服 
， 在 $HOME/.cargo 目 录 下 创建 一 个 名 为 config 的 文本 文 
， 其 内 容 为 : 





[source.crates-io] 

registry = "https://github.com/rust-lang/crates.io-index" 
replace-with = 'ustc' 

[source.ustc] 

registry = "git://mirrors.ustc,.edu.cn/crates.io-index" 








这 样 ， 在 编译 需要 依赖 crates.io 的 项 目 时 ， 不 会 由 于 网 络 问 题 导致 
依赖 库 下 载 失 败 。 


RLS (Rust Language Server) 是 官方 提供 的 一 个 标准 化 的 编辑 器 增 
强 工 具 。 它 也 是 开源 的 ， 项 目地 址 在 https://github.com/rust-lang- 
nursery/rls 。 它 是 一 个 单独 的 进程 ， 通 过 进程 间 通 信 给 编辑 器 或 者 集成 
开发 环境 提供 一 些 信 息 ， 实 现 比较 复杂 的 功能 ， 比 如 代码 自动 提示 、 中 
转 到 定义 、 显 示 函 数 签名 等 。 安 装 最 新 的 RLS 的 方法 为 : 














// 更 新 rustup 到 最 新 

rustup self update 

// 更 新 rust 编 译 器 到 最 新 的 nightly 版 本 

rustup update nightJy 

// 安装 RLS 

rustup component add rls --toolchain nightly 

rustup component add rust-analysis --toolchain nightly 











rustup component add rust-src --toolchain nightly 





有 了 这 些 准 备 ， 大 家 就 可 以 在 Visual Studio Code 中 下 载 支 持 Rust 的 
插件 ， 提 升 编辑 体验 。 理 论 上 来 襄 ，RLS 可 以 跟 任 何 编 辑 器 或 者 集成 开 
发 环境 配合 使 用 ， 只 要 这 个 编辑 器 实现 了 它们 之 间 的 通信 协议 即 可 。 


有 了 上 面 这 些 准备 工作 ， 我 们 束 可 以 正式 开始 Rust 编 程 之 旅 了 。 首 
先 ， 打 开 命 令 行 工 具 ， 看 看 rustc 编 译 器 能 否 正 常 运 行 ， 使 用 -V 命 令 查 看 
rustc 的 版 本 : 





$ rustc -V 
rustc 1.20.0-nightly (f85579d4a 2017-07-12) 








如 果 看 到 类 似 的 输出 ， 说 明 编 译 占 已 经 可 以 正常 工作 。 接 下 来 ， 请 
大 家 探索 一 下 这 些 工 具 的 简明 使 用 帮助 : 


1) 使 用 rustc-h 命 令 查 看 rustc 的 基本 用 法 ; 

2) 使 用 cargo-h 命 令 碍 看 cargo 的 基本 用 法 ; 

3) 使 用 rustc-C help 命 令 查看 rustc 的 一 些 跟 代码 生成 相关 的 选项 ; 
4) 使 用 rustc-W help 命 令 查看 rustc 的 一 些 跟 代码 警告 相关 的 选项 ; 


5) 使 用 rustc-Z help 命 令 查 看 rustc 的 一 些 跟 编译 器 内 部 实现 相关 的 
选项 ; 


6) 使 用 rustc-help-V 命 令 查 看 rustc 的 更 详细 的 选项 说 明 。 


1.3 Hello World 


编程 语言 入 门 第 一 课 ， 必 须 得 是 hello world 程 序 。 我 们 先 来 看 看 
Rust 的 hello world 是 什么 样子 : 





// hello_ world.rs 

fn main() { 
let s = "hello world!"; 
println!i("{}", s); 





对 于 这 样 一 个 简单 的 示例 程序 ， 我 们 并 没有 使 用 cargo 创 建 工程 ， 
i 编译 就 直接 使 用 rustc 即 可 ， 其 他 所 有 选项 使 
默认 值 : 





rustc hello worild.rs 





可 看 到 本 地 文件 夹 中 生成 了 一 个 名 为 hello_world 的 可 执行 程序 。 执 
行 ./hello_world 程 序 ， 可 以 看 见 控 制 台 上 输出 了 hello world! 字符 串 。 茶 
喜 读 者 ， 第 一 个 Rust 程 序 已 经 运行 成 功 了 ! 


我 们 来 分 析 一 下 这 个 了 最 简单 的 程序 。 


1) 一 般 Rust 源 代码 的 后 绥 名 使 用 .rs 表示 。 源 码 一 定 要 注意 使 用 utf- 
8 编码 。 


2) 第 一 行 是 注释 语句 ，Rust 的 注释 是 C 语 言 系列 风格 的 ， 行 注释 采 
用 /开头 ， 块 注释 使 用 #* 和 */ 包 围 。 它 还 支持 更 高 级 的 文档 注释 ， 将 在 后 
文中 详细 展开 说 明 。 


3) fn 是 一 个 关键 字 (key word) ， 函 数 定义 必须 以 这 个 关键 字 开 
汰 。 函 数 体 使 用 大 插 号 来 包含 。 甸 是 单词 function 的 缩写 ， 在 Rust 中 ， 设 
计 者 比较 偏 问 使 用 单词 缩写 ， 即 使 是 关键 字 也 不 例外 。 在 代码 风格 上 ， 
某 些 读者 可 能 开始 会 有 点 不 习惯 。 但 总 体 而 言 ， 这 只 是 个 审美 偏好 而 
己 ， 不 必 过 于 纠结 ， 习 惯 就 好 。 

















4) 默认 情况 下 ，main 函 数 是 可 执行 程序 的 入 口 点 ， 它 是 一 个 无 参 
数 ， 无 返回 值 的 函数 。 如 果 我 们 要 定义 的 函数 有 参数 和 返回 值 ， 可 以 使 
用 以 下 语法 《参数 列表 使 用 去 呈 分开， 冒号 后 面 是 类 型 ， 返 回 值 类 型 使 


用 -> 符号 分 隔 ) : 


fn Foo( input1 : i32, input2 : U32) -> i32 { 
} 





5) 局 部 变量 声明 使 用 let 关 键 字 开头 ， 用 双 引 号 包 合 起 来 的 部 分 是 
字符 溃 凋 量 。Rnust 是 静态 强 类 型 语言 ， 所 有 的 变量 都 有 严格 的 编译 期 语 
法 检查 。 关 于 Rust 的 变量 和 类 型 系统 将 在 后 文 详细 说 明 。 





6) 每 条 语句 使 用 分 号 结尾 。 语 句 块 使 用 大 括号 。 空 格 、 换 行 和 缩 
进 不 是 语法 规则 的 一 部 分 。 这 都 是 明显 的 C 语 言 系列 的 风格 。 


最 简单 的 标准 输出 是 使 用 printtn ! 宏 来 完成 。 请 大 家 一 定 注 意 
printin 后 面 的 感叹 号 ， 它 代表 这 是 一 个 宏 ， 而 不 是 一 个 函数 。Rust 中 的 
宏 与 C/C++ 中 的 宏 是 完全 不 一 样 的 东西 。 简 单 点 说 ， 可 以 把 它 理解 为 一 
种 安全 版 的 编译 期 语法 扩展 。 这 里 之 所 以 使 用 宏 ， 而 不 是 函数 ， 是 因为 
标准 输出 宏 可 以 完成 编译 期 格式 检查 ， 更 加 和 安全。 








从 这 个 小 程序 的 惊 鸿 一 和 警 中 ， 大 家 可 以 看 到 ，Rust 的 语法 主要 还 是 
C 系 列 的 语法 风格 。 对 于 熟悉 C/C++/Java/C#/PHP/JavaScript 等 语言 的 读 
者 来 说 ， 会 看 到 许多 熟悉 的 身影 。 


1.4 Prelude 


Rust 的 代码 从 逻辑 上 是 分 crate 和 mod 管 理 的 。 所 谓 crate 大 家 可 以 理 
解 为 “项 目 ”"。 每 个 crate 是 一 个 完整 的 编译 单元 ， 它 可 以 生成 为 一 个 lib 或 
者 exe 可 执行 文件 。 而 在 crate 内 部 ， 则 是 由 mod 这 个 概念 管理 的 ， 所 谓 
mod 大 家 可 以 理解 为 namespace。 我 们 可 以 使 用 use 语 句 把 其 他 模块 中 的 
| 关于 Rust 模 块 系统 的 详细 说 明 ， 可 参见 本 书 
第 五 部 分 。 


Rust 有 一 个 极 简 标准 库 ， 叫 作 std， 除 了 极 少数 骨 入 式 系统 下 无 法 使 
用 标准 库 之 外 ， 绝 大 部 分 情况 下 ， 我 们 都 需要 用 到 标准 库 里 面 的 东西 。 
为 了 给 大 家 减少 麻烦 ，Rust 编 译 器 对 标准 库 有 特殊 处 理 。 默 认 情况 下 ， 
用 户 不 需要 手动 添加 对 标准 库 的 依赖 ， 编 译 堪 会 自动 引入 对 标准 库 的 依 
赖 。 除 此 之 外 ， 标 准 库 中 的 某 些 type、trait、function、macro 等 实在 是 太 
常用 了 。 每 次 都 号 use 语 句 确实 非常 无 聊 ， 因 此 标准 库 提 供 了 一 个 
std: : prelude 模 块 ， 在 这 个 模块 中 导出 了 一 些 最 常见 的 类 型 、trait 等 东 
西 ， 编 译 器 会 为 用 户 写 的 每 个 crate 上 自动 插入 一 句 话 : 


use std::prelude::*; 


这 样 ， 标 准 库 里 面 的 这 些 最 重要 的 类 型 、trait 等 名 字 就 可 以 直接 使 
用 ， 而 无 须 每 次 都 写 全 称 或 者 use 语 人 句 。 
Prelude 模 块 的 源码 在 src/libstd/prelude/ 文 件 夹 下 。 我 们 可 以 看 到 ， 


目前 的 mod.rs 中 ， 直 接 导 出 了 v1 模块 中 的 内 容 ， 而 vl.rs 中 ， 则 是 编译 器 
为 我 们 自动 导入 的 相关 trait 和 类 型 。 


1.5 Format 格 式 详 细 说 明 


在 后 面 的 内 容 中 ， 我 们 还 会 大 量 使 用 println! 宏 ， 因 此 提前 介绍 一 
下 这 个 宏 的 基本 用 法 。 跟 C 语 言 的 printf 函 数 类 似 ， 这 个 安全 注入 委 种 入 
式 控 制 ， 示 例如 下 : 





fn main() { 









































println!("{}", 1); // 默认 用 法 ,打印 Display 

printlin!("{: oF", 9); // 八 进 秆 

println!("{:x}", 255); // 十 六 进 制 小 写 

println!("{:X}", 255); // 十 六 进 制 大 写 

println!("{:p}", &0); // 指针 

println!("{:b}", 15); // 二 进 制 

println!("{:e}"，140000f32);  // 科学 计数 (小 写 ) 
println!("{:E}"，10000f32);  // 科学 计数 (大 写 ) 

printin! ("{: ?2}", "test"); // 打印 Debug 

println!("{:#?}", ("test1", "test2")); // 带 换行 和 缩 进 的 Debug 打印 

















println!("f{fa} {b} {fb}",， a = "x"，b = "y");  // 命名 参数 





Rust 中 还 有 一 系列 的 宏 ， 都 是 用 的 同样 的 格式 控制 规则 ， 如 
format! write! writeln! 等 。 详 细 文 档 可 以 参见 标准 库 文档 中 std: : fmt 
模块 中 的 说 明 。 


Rust 标 准 库 中 之 所 以 设计 了 这 么 一 个 宏 来 做 标准 输出 ， 主 要 是 为 了 
更 好 地 错误 检查 。 ea 如 打出 现 参 数 个 数 、 格 式 等 各 种 原因 
不 匹配 会 直接 导致 编译 错误 。 而 函数 则 不 具备 字符 串 格 式 化 的 静态 检查 
功能 ， 向 果 出 现 了 不 匹配 的 情况 只 能 是 运行 期 错误 。 这 个 宏 最 终 还 是 
调用 了 std: : io 模块 内 提供 的 一 些 函 数 来 完成 的 。 如 采用 户 需 要 更 精细 
地 控制 标准 输出 操作 ， 也 可 以 直接 调用 标准 库 来 完成 。 

















第 2 章 ”变量 和 类 型 
2.1 变量 声明 


Rust 的 变量 必须 先 声 明 后 使 用 。 对 于 局 部 变量 ， 最 常见 的 声明 语法 
为 : 











Jet variable : i32 = 100; 


与 传统 的 C/C++ 语言 相 比 ，Rust 的 变量 声明 语法 不 同 。 这 样 设 计 主 
要 有 以 下 几 个 方面 的 考虑 。 


1. 语 法 分 析 更 容易 


从 语法 分 析 的 角度 来 说 ，Rust 的 变量 声明 语法 比 C/C++ 语 言 的 简 
单 ， 局 部 变量 声明 一 定 是 以 关键 字 let 开 头 ， 类 型 一 定 是 跟 在 骨 号 : 的 后 
面 。 语 法 歧义 更 少 ， 语 法 分 析 器 更 容易 编写 。 


2. 方 便 引 入 类 型 推导 功能 


Rust 的 变量 声明 的 一 个 重要 特点 是 : 要 声明 的 变量 前 置 ， 对 它 的 类 
型 揪 述 后 置 。 这 也 是 吸取 了 其 他 语言 的 教训 后 的 结果 。 因 为 在 变量 声明 
语句 中 ， 节 重要 的 是 变量 本 身 ， 而 类 型 其 实 是 个 附属 的 额外 描述 ， 并 非 
必 不 可 少 的 部 分 。 如 果 我 们 可 以 通过 上 下 文 环 境 由 编译 右上 自动 分 析出 这 
个 变量 的 类 型 ， 那 么 这 个 类 型 描述 完全 可 以 省 略 不 写 。Rust 一 开始 的 设 
计 就 考虑 了 类 型 目 动 推导 功能 ， 因 此 类 型 后 置 的 语法 更 合适 。 


3. 模 式 解 构 


let 语 句 不 光 是 局 部 变量 声明 语句 ， 而 且 具 有 pattern destructure 〈 模 
式 解 构 ) 的 功能 。 关 于 “模式 解构 ?的 内 容 在 后 面 的 章节 会 详细 描述 。 


实际 上 ， 包 括 C++/C#/Java 等 传统 编程 语言 都 开始 逐步 引入 这 种 声 
明 语 法 ， 目 的 是 相似 的 。 





























Rust 中 声明 变量 缺 省 是 “只 读 ” 的 ， 比 如 如 下 程序 : 





fn main() { 
let x = 5; 
x = 10; 
} 





会 得 到 “re-assignment of immutable variable x” 这 样 的 编译 错误 。 


如 果 我 们 需要 让 变量 是 可 写 的 ， 那 么 需要 使 用 mut 关 键 字 : 








Jet mut x = 5; // mut x: i32 
x = 10; 





此 时 ， 变 量 x 才 是 可 读 写 的 。 


实际 上 ，let 语 句 在 此 处 引入 了 一 个 模式 解构 ， 我 们 不 能 把 let mut 视 
为 一 个 组 合 ， 而 应 该 将 mut x 视 为 一 个 组 合 。 


mut x 是 一 个 “模式 ”， 我 们 还 可 以 用 这 种 方式 同时 声明 多 个 变量 : 











let (mut a, mut b) = (1, 2); 
Jet Point { x: ref a, yi ref b} = p; 











其 中 ， 赋 值 号 左边 的 部 分 是 一 个 “模式 ?”， 第 一 行 代码 是 对 tuple 的 模 
式 解构 ， 第 二 行 代码 是 对 结构 体 的 模式 解构 。 所 以 ， 在 Rust 中 ， 一 般 把 
声明 的 局 部 变量 并 初始 化 的 语句 称 为 "变量 绑 定 ”， 强 调 的 是 “ 绑 定 ”的 含 
义 ， 与 C/C++ 中 的 “赋值 初始 化 ”语句 有 所 区 别 。 


Rust 中 ， 每 个 变量 必须 被 合理 初始 化 之 后 才能 被 使 用 。 使 用 未 初始 
化 变量 这 样 的 错误 ， 在 Rust 中 是 不 可 能 出 现 的 〈 利 用 unsafe 做 hack 除 
外 ) 。 如 下 这 个 简单 的 程序 ， 也 不 能 编译 通过 : 











fn main() { 
let x: i32; 
println!i("{}", x); 
} 





错误 信息 为 : 





error: Use of possibly uninitialized variable: ‘x. 











ee 
初始 化 : 





fn test(condition: bool) { 
let x: i32; // 声明 Xx, 不 必 使 用 mut 修饰 
if condition { 











Xx = 1; // 初始 化 x, 不 需要 x 是 mut 的 ,因为 这 是 初始 化 , 不 是 修改 











println!("{}", x); 
} 
// 如 果 条 件 不 满足 ,x 没有 被 初始 化 


// 但 是 没关系 , 只 要 这 里 不 使 用 x 就 没事 












































类 型 没有 “默认 构造 函数 ”"， 变 量 没 有 “默认 值 "?。 对 于 let x: i32; 如 
果 没 有 显 式 赋值 ， 它 就 没有 被 初始 化 ， 不 要 想当然 地 以 为 它 的 值 是 0。 


Rust 里 的 合法 标识 符 〈( 包 括 变 量 名 、 消 数 名 、trait 名 等 ) 必须 由 数 
字 、 字 母 、 下 划 线 组 成 ， 且 不 能 以 数字 开头 。 这 个 规定 和 许多 现 有 的 编 
程 语 言 是 一 样 的 。Rust 将 来 会 允许 其 他 Unicode 字 符 做 标识 符 ， 只 是 目 
前 这 个 功能 的 优先 级 不 高 ， 还 没有 最 终 定 下 来 。 另 外 还 有 一 个 raw 
identifier 功 能 ， 可 以 提供 一 个 特殊 语法 ， 如 r#self， 让 用 户 可 以 以 关键 字 
作为 普通 标识 符 。 这 只 是 为 了 应 付 某 些 特殊 情况 时 迫不得已 的 做 法 。 


Rust 里 面 的 下 划 线 是 一 个 特殊 的 标识 人生， 在 编译 器 内 部 它 是 被 特殊 
处 理 的 。 它 跟 其 他 标识 符 有 许多 重要 区 别 。 比 如 ， 以 下 代码 就 编译 不 
j 




















fn main() { 
let _ = "hello"; 
println!i("{}", _); 





我 们 不 能 在 表达 陈 中 使 用 下 划 线 来 作为 普通 变量 使 用 。 下 划 线 表达 
的 含义 是 “忽略 这 个 变量 绑 定 ， 后 面 不 会 再 用 到 了 ”。 在 后 面 讲 析 构 的 时 


候 ， 还 会 提 到 这 一 点 。 
2.1.1 变量 遮 责 


Rust 允 许 在 同一 个 代码 块 中 声明 同样 名 字 的 变量 。 如 果 这 样 做 ， 后 
面 声明 的 变量 会 将 前 面 声明 的 变量 “ 遮 巩 ”(《Shadowing) 起来。 








fn main() { 
let x = "hello"; 
println!i("x Is {}", x); 


let x = 5; 
println!i("x Is {}", x); 


} 








上 面 这 个 程序 是 可 以 编译 通过 的 。 请 注意 第 5 行 的 代码 ， 它 不 是 
x=5; ， 它 前 面 有 一 个 let 关 键 字 。 如 采 没 有 这 个 let 和 关键 字 ， 这 条 语句 就 
是 对 x 的 重新 绑 定 《重新 赋值 ) 。 而 有 了 这 个 let 关 键 字 ， 束 是 又 声明 了 
一 个 新 的 变量 ， 只 是 它 的 名 字 恰 巧 与 前 面 一 个 变量 相同 而 已 。 


但 是 这 两 个 x 代表 的 内 存 空间 完全 不 同 ， 类 型 也 完全 不 同 ， 它 们 实 
际 上 是 两 个 不 同 的 变量 。 从 第 5 行 开 始 ， 一 直到 这 个 代码 块 结束 ， 我 们 
没有 任何 办 法 再 去 访问 前 一 个 x 变 量 ， 因 为 它 的 名 字 已 经 被 诞 丽 了 。 


变量 遮 贡 在 某 些 情况 下 非常 有 有 用， 比如， 我 们 需要 在 同一 个 函数 内 
部 把 一 个 变量 转换 为 刃 一 个 类 型 的 变量 ， 但 又 不 想 给 它们 起 不 同 的 名 
字 。 再 比如 ， 在 同一 个 函数 内 部 ， 需 要 修改 一 个 变量 绑 定 的 可 变性 。 例 
如 ， 我 们 对 一 个 可 变数 组 执行 初始 化 ， 希 望 此 时 它 是 可 读 写 的 ， 但 是 初 
始 化 完成 后 ， 我 们 希望 它 是 只 读 的 。 可 以 这 样 做 : 


















































// 注意 : 这 段 代 码 只 是 演示 变量 遮蔽 功能 , 并 不 是 Vec 类 型 的 最 佳 初 始 化 方法 
fn main() { 















































let mut v = Vec::new(); // Vv 必须 是 mut 修 饰 , 因为 我 们 需要 对 它 写 入 数据 

v.push(1); 

v.push(2); 

v.push(3); 

let v= v; // 从 这 里 往 下 , v 成 了 只 读 变 量 , 可 读 写 变量 V 已 经 被 遮蔽 ,无 法 再 i 















































for i in &v { 
println!("{}", 1); 
} 
} 


二 一 


反 过 来 ， 如 果 一 个 变量 是 不 可 变 的 ， 我 们 也 可 以 通过 变量 诞 蔽 创建 一 个 
新 的 、 可 变 的 同名 变量 。 





fn main() { 
let v = Vec::new(); 
let mut v = v; 
v.push(1); 
println!i("{:?}", Vv); 





请 注意 ， 这 个 过 程 是 符合 “内 存 安 全 ”的 。“ 内 存 安全 ”的 概念 一 直 是 
Rust 关 注 的 重点 ， 我 们 将 在 第 二 部 分 详细 讲述 。 在 上 面 这 个 示例 中 ， 我 
们 需要 理解 的 是 ， 一 个 “不 可 变 绑 定 ?依然 是 一 个 “变量 ”。 虽 然 我 们 没 办 
法 通过 这 个 “变量 绑 定 ?修改 变量 的 值 ， 但 是 我 们 重新 使 用 “可 变 绑 定之 
后 ， 还 是 有 机 会 修改 的 。 这 样 做 并 不 会 产生 内 存 安 全 问题 ， 因 为 我 们 对 
这 块 内 存 拥 有 完整 的 所 有 权 ， 且 此 时 没有 任何 其 他 引用 指向 这 个 变量 ， 
对 这 个 变量 的 修改 是 完全 合法 的 。Rust 的 可 变性 控制 规则 与 其 他 语言 不 
一 样 。 更 多 内 容 请 参阅 本 书 第 二 部 分 内 存 安全 。 


实际 上 ， 传 统 编程 语言 C/C++ 中 也 存在 类 似 的 功能 ， 只 不 过 它们 只 
允许 伦 套 的 区 域内 部 的 变量 出 现 诞 巩 。 而 Rust 在 这 方面 放 得 稍微 宽 一 
点 ， 同 一 个 语句 块 内 部 声明 的 变量 也 可 以 发 生 遮 贡 。 


























2.1.2 ”类型 推导 





Rust 的 类 型 推导 功能 是 比较 强大 的 。 它 不 仅 可 以 从 变量 声明 的 当前 
语句 中 获取 信息 进行 推导 ， 而 且 还 能 通过 上 下 文 信 息 进 行 推导 。 








fn main() { 
// 没有 明确 标 出 变量 的 类 型 , 但 是 通过 字 卫 
// 编译 器 知道 elem 的 类 型 为 u8 
let elem = 5u8 





























量 的 后 绥 ， 























// 创建 一 个 动态 数组 , 数组 内 包含 的 是 什么 元 素 类 型 可 以 不 写 
Jet mut vec = Vec::new(); 

vec.push(elem); 
// 到 后 面 调用 了 push 函 数 , 通 过 elem 变 量 的 类 型 ， 
// 编译 器 可 以 推导 出 vec 的 实际 类 型 是 Vec<u8> 




































































println!("{:?}", vec); 











我 们 甚至 还 可 以 只 写 一 部 分 类 型 ， 剩 下 的 部 分 让 编译 器 去 推导 ， 比 
如 下 面 的 这 个 程序 ， 我 们 只 知道 players 变 量 是 Vec 动 态 数组 类 型 ， 但 是 
里 面包 含 什么 元 素 类 型 并 不 清楚 ， 可 以 在 尖 括 号 中 用 下 划 线 来 代 蔡 : 








fn main() { 
let player_scores = [ 
("Jack", 20), ("Jane", 23), ("Jill", 18), ("John", 19), 
]; 


// players 是 动态 数组 , 内 部 成 员 的 类 型 没有 指定 , 交 给 编译 器 自动 推导 
let players : Vec< > = player_scores 
.iter() 
.map(|&(player, _score)| { 
player 






































}) 
.collect(); 


println!("{:?}", players); 





自动 类 型 推导 和 “动态 类 型 系统 ”是 两 码 事 。Rust 依 然 是 静态 类 型 
的 。 一 个 变量 的 类 型 必须 在 编译 阶段 确定 ， 且 无 法 更 改 ， 只 是 菜 些 时 候 
不 需要 在 源码 中 显 式 写 出 来 而 已 。 这 只 是 编译 器 给 我 们 提供 的 一 个 辅助 
工具 。 


Rust 只 允许 “局 部 变量 /全 局 变量 ?实现 类 型 推导 ， 而 函数 签名 等 场景 
下 是 不 允许 的 ， 这 是 故意 这 样 设 计 的 。 这 是 因为 局 部 变量 只 有 局 部 的 影 
啊 ， 全 局 变量 必须 当场 初始 化 而 函数 签名 具有 全 局 性 影响 。 函 数 签 名 如 
果 使 用 自动 类 型 推导 ， 可 能 导致 条 个 调用 的 地 方 使 用 方式 发 生变 化 ， 它 
的 参数 、 返 回 值 类 型 就 发 生 了 变化 ， 进 而 导致 远 处 男 一 个 地 方 的 编译 错 
误 ， 这 是 设计 者 不 希望 看 到 的 情况 。 























2.1.3 ”类 型 别名 


我 们 可 以 用 type 关 键 字 给 同一 个 类 型 起 个 别名 (type alias) 。 示 例 
如 下 : 





type Age = u32,; 


fn grow(age: Age, year: U32) -> Age { 
age + year 
} 


fn main() { 

let x : Age = 20; 

println!("20 years later: {}", grow(x, 20)); 
} 





类 型 别名 还 可 以 用 在 泛 型 场景 ， 比 如 : 























type Double<T> = (T，Vec<T>); // 小 括号 包围 的 是 一 个 tuple, 请 参见 后 文中 的 复合 数据 类 型 








那么 以 后 使 用 Double<i32> 的 时 候 ， 束 等 同 于 〈i32，Vec<i32>) ， 
可 以 简化 代码 。 


2.1.4， 静态 变量 


Rust 中 可 以 用 static 关 键 字 声明 静态 变量 。 如 下 所 未: 





static GLOBAL: i32 = 0; 





与 let 语 句 一 样 ，static 语 句 同 样 也 是 一 个 模式 匹配 。 与 let 语 句 不 同 的 
是 ， 用 static 声 明 的 变量 的 生命 周期 是 整个 程序 ， 从 局 动 到 退出 。static 
变量 的 生命 周期 永远 是 'static， 它 占用 的 内 存 空间 也 不 会 在 执行 过 程 中 
回收 。 这 也 是 Rust 中 唯一 的 声明 全 局 变量 的 方法 。 


由 于 Rust 非 常 注重 内 存 安全 ， 因 此 全 局 变量 的 使 用 有 许多 限制 。 这 
些 限制 都 是 为 了 防止 程序 员 写 出 不 安全 的 代码 : 


全 局 变量 必须 在 声明 的 时 候 马 上 初始 化 ; 


全 局 变量 的 初始 化 必须 是 编译 期 可 确定 的 第 量 ， 不 能 包括 执行 期 
才能 确定 的 表达 式 、 语 句 和 函数 调用 ; 


:和 带 有 mut 修 饰 的 全 局 变量 ， 在 使 用 的 时 候 必 须 使 用 unsafe 关 键 字 。 
示例 如 下 : 











fn main() { 














// 局 部 变量 声明 , 可 以 留待 后 面 初始 化 , 只 要 保证 使 用 前 已 经 初始 化 即 可 



































Jet x; 
let y = 1 i32; 
x = 2_i32,; 


println!("{} {}", x, y); 


// 全 局 变量 必须 声明 的 时 候 初始 化 , 因为 全 局 变量 可 以 写 到 函数 外 面 , 被 任意 一 个 函数 使 用 
static G1 : i32 = 3; 
println!("{}", G1); 













































































// 可 变 全 局 变量 无 论 读 写 都 必须 用 unsafe 修 饰 
static mut G2 : i32 = 4; 
unsafe { 
G2 = 5; 
println!i("{}", G2); 









































// 全 局 变量 的 内 存 不 是 分 配 在 当前 函数 栈 上 , 函数 退出 的 时 候 , 并 不 会 销毁 全 局 变量 占用 的 内 存 空间 , 程序 退 4 























才 


修 








Rust 禁 止 在 声明 static 变 量 的 时 候 调 用 普通 函数 ， 或 者 利用 语句 块 调 
用 其 他 非 const 代 码 : 





// 这 样 是 允许 的 

static array : [i32; 3] = [1,2,3]; 

// 这 样 是 不 允许 的 

static vec : Vec<i32> = { let mut v = Vec::new(); Vv.push(1); v }; 











调用 const fn 是 允许 的 : 





#![feature(const_fn)] 
fn main() { 
use std::sync::atomic::AtomicBool; 
static FLAG: AtomicBool = AtomicBool: :new(true); 





因为 const fn 是 编译 期 执行 的 。 这 个 功能 在 编写 本 书 的 时 候 目 前 还 没 
有 stable， 因 此 需要 使 用 nightly 版 本 并 打开 feature gate 才 能 使 用 。 


Rnust 不 允许 用 户 在 main 函 数 之 前 或 者 之 后 执行 目 己 的 代码 。 所 以 ， 
比较 复杂 的 static 变 量 的 初始 化 一 般 需 要 使 用 lazy 方 式 ， 在 第 一 次 使 用 的 
时 候 初 始 化 。 在 Rust 中 ， 如 果 用 户 需 要 使 用 比较 复杂 的 全 局 变量 初始 
化 ， 推 荐 使 用 lazy_static 库 。 


2.1.5 常量 


在 Rust 中 还 可 以 用 const 关 键 字 做 声明 。 如 下 所 示 : 





const GLOBAL: i32 = 0; 











使 用 const 声 明 的 是 和 常量， 而 不 是 变量 。 因 此 一 定 不 允许 使 用 mut 关 
键 字 修饰 这 个 变量 绑 定 ， 这 是 语法 错误 。 常 量 的 初始 化 表达 式 也 一 定 要 
是 一 个 编译 期 常量 ， 不 能 是 运行 期 的 值 。 它 与 static 变 量 的 最 大 区 别 在 
于 : 编译 器 并 不 一 定 会 给 const 常 量 分 配 内 存 空 间 ， 在 编译 过 程 中 ， 它 很 
可 能 会 被 内 联 优化 。 因此 ， 用 户 千 万 不 要 用 hack 的 方式 ， 通 过 unsafe 代 
码 去 修改 党 量 的 值 ， 这 么 做 是 没有 意义 的 。 以 const 声 明 一 个 常量 ， 也 不 
具备 类 似 let 语 句 的 模式 匹配 功能 。 




















2.2 ”基本 数据 类 型 


2.2.1 bool 


布尔 类 型 (bool) 代表 的 是 “是 ?和 “ 侣 ”的 二 值 逻 辑 。 它 有 两 个 值 : 
true 和 false。 一 般 用 在 逻辑 表达 式 中 ， 可 以 执行 “与 ”* 或 ”“ 非 ”等 运算 。 





fn main() { 
let x = true,; 
let y: bool = !x; // 取 反 运算 


let z = x && yi // 逻辑 与 , 带 短 路 功能 
println!("{}", Zz); 





let z=x || y; // 逻辑 或 , 带 短 路 功能 
println!i("{}", Zz); 


let z= x&y; // 按 位 与 ,不 带 短 路 功能 
println!i("{}", Zz); 





let z=x | y; // 按 位 或 ,不 带 短路 功能 
println!("{}", Zz); 





let z= x 人 ^y; // 按 位 异 或 ,不 带 短 路 功能 
println!("{}", Zz); 








一 些 比较 运算 表达 式 的 类 型 就 是 bool 类 型 : 





fn logical op(x: i32, y: i32) { 
let z : bool = x < y; 
printlin!("{}", Zz); 





bool 类 型 表达 式 可 以 用 在 if/while 等 表达 式 中 ， 作 为 条 件 表 达 式 。 比 
如 : 





if a >= bf 
} else { 
和 


ee | 


2.2.2 chiar 


字符 类 型 由 char 表 示 。 它 可 以 描述 任何 一 个 符合 unicode 标 准 的 字符 
值 。 在 代码 中 ， 单 个 的 字符 字面 量 用 单 引号 包围 。 





let love = '®”®'， // 可 以 直接 杠 入 任何 unicode 字符 








字符 类 型 字面 量 也 可 以 使 用 转 义 符 : 








Tot Ch "ity // 换行 符 
let c2 = '\x7f'; // 8 bit 字符 变量 
let c3 = '\u{7FFF}'; // unicode 字 符 





因为 char 类 型 的 设计 目的 是 描述 任意 一 个 unicode 字 符 ， 因 此 它 占 据 
的 内 存 空间 不 是 1 个 字 节 ， 而 是 4 个 字 节 。 


对 于 ASCII 字 符 其 实 只 需 占用 一 个 字 节 的 空间 ， 因 此 Rust 提 供 了 单 
字 节 字符 字面 量 来 表示 ASCII 字 符 。 我 们 可 以 使 用 一 个 字母 b 在 字符 或 者 
字符 串 前 面 ， 代 表 这 个 字面 量 存储 在 u8 类 型 数组 中 ， 这 样 占用 空间 比 
char 型 数组 要 小 一 些 。 示 例如 下 : 

















lJet x :u8 = 1 

Jet y :u8 = b'A'; 

let s :&[u8;5] = b"hello"; 

let r :&[u8;14] = br#"hello \n world"#; 





2.2.3 ”整数 类 型 


Rust 有 许多 的 数字 类 型 ， 主 要 分 为 整数 类 型 和 浮 点 数 类 型 。 本 市 讲 
解 整数 类 型 。 各 种 整数 类 型 之 间 的 主要 区 分 特征 是 : 有 符号 /无 符号 ， 
占据 空间 大 小 。 具 体 见 表 2-1。 





表 2-1 


整数 类 型 有 符号 无 符号 
16 bite 16 


32 bits 132 U32 
64 bits 164 u64 


Pointer size 1S1Ze US1Ze 


所 谓 有 符号 /无 符号 ， 指 的 是 如 何 理解 内 存 空 间 中 的 bit 表 达 的 含 
义 。 如 果 一 个 变量 是 有 符号 类 型 ， 那 么 它 的 最 高 位 的 那 一 个 bit 就 是 “ 符 
号 位 ”， 表 示 该 数 为 正 值 还 是 负 值 。 如 果 一 个 变量 是 无 符号 类 型 ， 那 么 
它 的 最 高 位 和 其 他 位 一 样 ， 表 示 该 数 的 大 小 。 比 如 对 于 一 个 byte 大 小 
(8 bits) 的 数据 来 说 ， 如 果 存 的 是 无 符号 数 ， 那 么 它 的 表达 范围 是 0 一 
255， 如 果 存 的 是 有 符号 数 ， 那 么 它 的 表达 范围 是 -128 一 127。 


关于 各 个 整数 类 型 所 占据 的 空间 大 小 ， 在 名 字 中 就 已 经 表现 得 很 明 
确 了 ，Rust 原 生 支 持 了 从 8 位 到 128 位 的 整数 。 需 要 特别 关注 的 是 isize 和 
usize 类 型 。 它 们 占据 的 空间 是 不 定 的 ， 与 指针 占据 的 空间 一 致 ， 与 所 在 
的 平台 相关 。 如 果 是 32 位 系统 上 ， 则 是 32 位 大 小 ; 如 果 是 64 位 系统 上 ， 
则 是 64 位 大 小 。 在 C++ 中 与 它们 相对 应 的 类 似 类 型 是 int_ptr 和 uint_ptr。 
Rust 的 这 一 策略 与 C 语 言 不 同 ，C 语 言 标 准 中 对 许多 类 型 的 大 小 并 没有 做 
强制 规定 ， 比 如 int、long、double 等 类 型 ， 在 不 同 平 台 上 都 可 能 是 不 同 
的 大 小 ， 这 给 许多 程序 员 带 来 了 不 必要 的 麻烦 。 相 反 ， 在 语言 标准 中 规 
定好 各 个 类 型 的 大 小 ， 让 编译 器 针对 不 同 平台 做 适 配 ， 生 成 不 同 的 代 
码 ， 是 更 合理 的 选择 。 


数字 类 型 的 字面 量 表示 可 以 有 许多 方式 : 



































let var1 : i32 = 32; // 十 进 制 表示 
































let var2 : i32 = QxFF; // 以 9x 开头 代表 十 六 进 制 表示 
let var3 :; i32 = 0055; // 以 Qo 开头 代表 八进制 表示 
let var4 : i32 = 0b1001， // 以 gb 开头 代表 二 进 制 表示 





注意 ! 在 C/C++/JavaScript 语 言 中 以 0 开头 的 数字 代表 八进制 坑 过 不 
少 人 ，Rust 中 设计 不 一 样 。 


在 所 有 的 数字 字面 量 中 ， 可 以 在 任意 地 方 添加 任意 的 下 划 线 ， 以 方 
便 阅 读 : 

















let var5 = 0x_1234_ABCD // 使 用 下 划 线 分 割 数 字 , 不 影响 语义 ,但 是 极 大 地 提升 了 阅读 体验 。 











字面 量 后 面 可 以 跟 后 缀 ， 可 代表 该 数字 的 具体 类 型 ， 从 而 省 略 掉 显 
示 类 型 标记 : 








let var6 = 123usize; // i6 变 量 是 usize 类 型 
let var7 = Ox_ff_u8; // i7 变 量 是 u8 类 型 
let var8 = 32; // 不 写 类 型 ,默认 为 i32 类 型 











在 Rust 中 ， 我 们 可 以 为 任何 一 个 类 型 添加 方法 ， 整 型 也 不 例外 。 比 
如 在 标准 库 中 ， 整 数 类 型 有 一 个 方法 是 pow， 它 可 以 计算 n 次 蜂 ， 于 是 
我 们 可 以 这 么 使 用 : 





let x : i32 = 9 
println!("9 power 3 = {}", x.pow(3)); 








同 理 ， 我 们 甚至 可 以 不 使 用 变量 ， 直 接 对 整 型 字面 量 调 用 函数 : 





fn main() { 
println!("9 power 3 = {}", 9_i32.pow(3)); 
} 





我 们 可 以 看 到 这 是 非常 方便 的 设计 。 


对 于 整数 类 型 ， 如 果 Rust 编 译 髓 通过 上 下 文 无 法 分 析出 该 变量 的 具 
体 类 型 ， 则 目 动 默认 为 i32 类 型 。 比 如 : 





fn main() { 
let x = 10; 
let y= x * x; 
println!("{}", y); 








在 此 例 中 ， 编 译 器 只 知道 x 是 一 个 整数 ， 但 是 具体 是 i8 i16 i32 或 者 
u8 u16 u32 等 ， 并 没有 足够 的 信息 判断 ， 这 些 都 是 有 可 能 的 。 在 这 种 情 
况 下 ， 编 译 器 就 默认 把 x 当成 132 类 型 处 理 。 这 么 做 的 好 处 是 ， 很 多 时 
候 ， 我 们 不 想 在 每 个 地 方 都 明确 地 指定 数字 类 型 ， 这 么 做 很 麻烦 。 给 编 
译 器 指定 一 个 在 信息 不 足 情况 下 的 “ 缺 省 ”类 型 会 更 方便 一 点 。 











2.2.4 整数 溢出 








在 整数 的 算术 运算 中 ， 有 一 个 比较 头疼 的 事情 是 “ 汶 出 ”。 在 C 语 言 
中 ， 对 于 无 符号 类 型 ， 算 术 运 算 永 远 不 会 overflow， 如 果 超 过 表示 范 
围 ， 则 自动 舍弃 高 位 数据 。 对 于 有 符号 类 型 ， 如 果 发 生 了 overflow， 标 
准 规定 这 是 undefined behavior， 也 就 是 说 随便 怎么 处 理 都 可 以 。 


未 定义 行为 有 利于 编译 器 做 一 些 更 激进 的 性 能 优化 ， 但 是 这 样 的 规 
定 有 可 能 导致 在 程序 员 不 知情 的 茶 些 极端 场景 下 ， 产 生 诡 异 的 bug。 


Rust 的 设计 思路 更 倾向 于 预防 bug， 而 不 是 无 条 件 地 压榨 效率 ，Rust 
设计 者 希望 能 尽量 减少 “未 定义 行为 ”。 比 如 彻底 杜绝 "Segment Fault” 这 
种 内 存 错误 是 Rust 的 一 个 重要 设计 目标 。 当 然 还 有 其 他 许多 种 类 的 
bug， 即 便 是 无 法 完全 解决 ， 我 们 也 希望 能 尽量 避免 。 整 数 溢出 束 是 这 
样 的 一 种 bug。 


Rust 在 这 个 问题 上 选择 的 处 理 方式 为 : 默认 情况 下 ， 在 debug 模 式 
下 编译 器 会 自动 插入 整数 溢出 检查 ， 一 旦 发 生 洪 出 ， 则 会 引发 panic; 在 
NE 不 检查 整数 溢出 ， 而 是 采用 上 自动 舍弃 高 位 的 方式 。 示 例 
0D 下 : 























fn arithmetic(m: i8, n: i8) { 
// 加 法 运算 ,有 溢出 风险 
println!i("{}", m+ nN); 








fn main() { 
let m : i8 = 120; 
let n : i8 = 120; 
arithmetic(m, n); 


} 


ee | 


如 果 我 们 编译 debug 版 本 : 





rustc test.rs 





执行 这 个 程序 ， 结 果 为 : 





thread 'main' panicked at 'attempt to add with overflow', test.rs:3:20 
note: Run with ‘RUST_BACKTRACE=1 for a backtrace. 





可 以 看 到 ， 程 序 执行 时 发 生 了 panic。 有 关 panic 的 详细 解释 ， 需 要 
参见 第 18 草 ， 此 处 无 须 深 入 细节 。 


如 果 编 译 一 个 优化 后 的 版 本 ， 加 上 -O 选 项 : 





rustc -0 test,rs 





执行 时 没有 错误 ， 而 是 使 用 了 目 动 截断 俩 略 : 





$ ./test 
-16 





Rust 编 译 器 还 提供 了 一 个 独立 的 编译 开关 供 我 们 使 用 ， 通 过 这 个 开 
天 ， 可 以 设置 溢出 时 的 处 理 策略 : 





$ rustc -C overflow-checks=no test .rs 





“-C overflow-checks=” 可 以 写 “yes? 或 者 “no”， 打 开 或 者 关闭 溢出 检 
得 。 如 果 我 们 用 上 面 这 个 命令 编译 ， 执 行 可 见 : 





$ ./test 
-16 





虽然 它 还 是 debug 版 本 ， 但 我 们 依然 有 办 法 关闭 洪 出 检查 。 


如 果 在 某 些 场景 下 ， 用 户 确 实 需 要 更 精细 地 自主 控制 整数 溢出 的 行 
为 ， 可 以 调用 标准 库 中 的 checked_*、saturating * 和 wrapping * 系 列 函 
数 。 





fn main() { 
let i = 100 i8; 
println!("checked {:?}", i.checked add(i)); 
println!("saturating {:?}", i,.saturating add(i)); 
println!("wrapping {:?}", i.wrapping_add(i)); 





输出 结果 为 : 





checked None 
saturating 127 
wrapping -56 





可 以 看 到 : checked_* 系 列 函 数 返 回 的 类 型 是 Option<_>， 当 出 现 洲 
出 的 时 候 ， 返 回 值 是 None; saturating * 系 列 函 数 返 回 类 型 是 整数 ， 如 果 
洲 出 ， 则 给 出 该 类 型 可 表示 范围 的 “最 大 /最 小 ” 值 ，wrapping_* 系 列 函 数 
则 是 直接 抛弃 已 经 溢出 的 最 高 位 ， 将 剩 下 的 部 分 返回 。 在 对 安全 性 要 求 
非常 高 的 情况 下 ， 强 烈 建议 用 户 尽 量 使 用 这 几 个 方法 蔡 代 默认 的 算术 运 
算 符 来 做 数学 运算 ， 这 样 表意 更 清晰 。 在 Rust 标 准 库 中 就 大 量 使 用 了 这 
几 个 方法 ， 而 不 是 简单 地 使 用 算术 运算 符 ， 值 得 大 家 参考 。 


在 很 多 情况 下 ， 整 数 溢出 应 该 被 处 理 为 截断 ， 即 丢弃 最 高 位 。 为 了 
方便 用 户 ， 标 准 库 还 提供 了 一 个 叫 作 std: : num: : Wrapping<T> 的 类 
型 。 它 重 载 了 基本 的 运算 符 ， 可 以 被 当成 普通 整数 使 用 。 凡 是 被 它 包 囊 
起 来 的 整数 ， 任 何 时 候 出 现 溢出 都 是 截断 行为 。 第 见 使 用 示例 如 下 : 

















use std::num: :Wrapping; 


fn main() { 
let big = Wrapping(std::u32::MAX); 
let sum = big + Wrapping(2_u32); 
println!i("{}", sum.0); 








不 论 用 什么 编译 选项 ， 上 述 代 码 痢 不 会 触及 panic， 任 何 情况 下 执行 
结果 都 是 一 致 的 。 


标准 库 中 还 提供 了 许多 有 用 的 方法 ， 在 此 不 一 一 歼 述 ， 请 大 家 参考 
标准 API 文 档 。 


2 .全局 大 量 


Rust 提 供 了 基于 IEEE 754-2008 标 准 的 浮 点 类 型 。 按 占据 空间 大 小 区 
分 ， 分 别 为 f32 和 f64， 其 使 用 方法 与 整 型 差别 不 大 。 浮 点 数字 面 量 表示 
方式 有 如 下 几 种 : 














let f1 = 123.0f64; // type f64 
let f2 = 0.1f64; // type f64 
let f3 = 0.1f32; // type f32 
let f4 = 12E+99_f64; // type f64 科学 计数 法 
Jet f5 : f64 = 2.,， // type f64 








与 整数 类 型 相 比 ，Rust 的 浮 点 数 类 型 相对 复杂 得 多 。 浮 点 数 的 麻烦 
之 处 在 于 : 它 不 仅 可 以 表达 正常 的 数值 ， 还 可 以 表达 不 正常 的 数值 。 


在 标准 库 中 ， 有 一 个 std: : num: : FpCategory 枚 举 ， 表 示 了 浮 点 
数 可 能 的 状态 : 





enum FpCategory { 
Nan, 
Infinite, 
Zero, 
Subnormal, 
Normal, 





其 中 Zero 表 示 0 值 、Normal 表 示 正 币 状 态 的 浮 点 数 。 其 他 几 个 就 需 
要 特别 解释 一 下 了 。 


在 IEEE 754 标 准 中 ， 规 定 了 浮 点 数 的 二 进 制 表 达 方 式 : x= (-1) 
As* (1+M) *2Ae。 其 中 s 是 符号 位 ，M 是 尾数 ，e 是 指数 。 尾 数 M 是 一 个 
[0，1) 范围 内 的 三 进 制 表示 的 小 数 。 以 32 位 浮 点 为 例 ， 如 果 只 有 normal 
形式 的 话 ，0 表 示 为 所 有 位 数 全 0， 则 最 小 的 非 零 正 数 将 是 尾数 最 后 一 位 
为 1 的 数字 ， 就 是 (1+2^ (-23) ) *2A (-127) ， 而 次 小 的 数字 为 
(1+2 人 和信 (-22) ) *2A (-127) ， 这 两 个 数字 的 差距 为 2^*(-23) 
*2 和 人 《-127) =2^ (-150) ， 然 而 最 小 的 数字 和 0 之 间 的 差距 有 


(1+2^A(〈-23) ) *2A (-127) ， 约 等 于 2A (〈(-127) ， 也 束 是 说 ， 数 字 在 
渐渐 减少 到 0 的 过 程 中 突然 降 到 了 0。 为 了 减少 0 与 最 小 数字 和 最 小 数字 
与 次 小 数字 之 间 步 长 的 突然 下 跌 ，subnormal 规 定 : 当 指 数位 全 0 的 时 


候 ， 指 数 表 示 为 -126 而 不 是 -127〈 和 指数 为 最 低位 为 1 一 致 ) 。 然 而 公式 
改 成 〈-1) As*M*2Ae，M 不 再 +1， 这 样 最 小 的 数字 就 变 成 2\《〈-23 ) 


*2A (-126) ， 次 小 的 数字 变 成 2A 〈-22) *2A (-126) ， 每 两 个 相 邻 
subnormal 数 字 之 差 都 是 2^ 〈-23) *2^ (-126) ， 避 免 了 突然 降 到 0。 在 
这 种 状态 下 ， 这 个 浮 点 数 就 处 于 了 Subnormal 状 态 ， 处 于 这 种 状态 下 的 
浮 点 数 表示 精度 比 Normal 状 态 下 的 精度 低 一 点 。 我 们 用 一 个 示例 来 演示 
一 下 什么 是 Subnormal 状 态 的 浮 点 数 : 





fn main() { 
// 变量 small 初始 化 为 一 个 非常 小 的 浮 点 数 
let mut small = Std::f32::EPSILON 
// 不 断 循环 , 让 small 越 来 越 趋 近 于 9, 直到 最 后 等 于 9 的 状态 
while small > 0.0 { 
small = small / 2.0; 
println!i("{} {:?}", small, small.classify()); 


夫人 
































} 
} 





编译 ， 执 行 ， 发 现 循环 几 十 次 之 后 ， 数 值 束 小 到 了 无 法 在 32bit 江 围 
内 合理 表达 的 程度 ， 最 终 收 敛 到 了 0， 在 后 面 表示 非常 小 的 数值 的 时 
修 ， 浮 点 数 就 已 经 进入 了 Subnormal 状 态 。 


Infinite 和 Nan 是 带 来 更 多 厂 烦 的 特殊 状态 。Infinite 代 表 的 是 “无 穷 
大 ”，Nan 代 表 的 是 “不 是 数字 ” (not a number) 。 


什么 情况 会 产生 “无 穷 大 ”和 “不 是 数字 ?” 呢 ? 举例 说 明 : 























fn main() { 
let x = 1.0f32 / 0.0; 
let y = 0.0f32 / 0.0; 

y println!("{} {}", x, y); 





编译 执行 ， 打 印 出 来 的 结果 分 别 为 iInf NaN。 非 0 数 除 以 0 值 ， 得 到 
的 是 inf，0 除 以 0 得 到 的 是 NaN。 


对 inf 做 一 些 数 学 运算 的 时 候 ， 它 的 结果 可 能 与 你 期 望 的 不 一 致 : 








fn main() { 

let inf = std::f32::INFINITY; 

println!i("{} {} {}", inf * 0.0, 1.0 / inf, inf / inf); 
} 





编译 执行 ， 结 果 为 : 





NaN © NaN 








NaN 这 个 特殊 值 有 个 特殊 的 抹 烦 ， 主 要 问题 还 在 于 它 不 具备 “全 
序 ” 的 特点 。 示 例如 下 : 





fn main() { 
let nan = std::f32::NAN; 
println!("{} {} 0", nan < nan, nan > nan, nan == nan); 





编译 执行 ， 输 出 结果 为 : 





false false false 








这 惑 很 麻烦 了 ， 一 个 数字 可 以 不 等 于 自己。 因为 NaN 的 存在 ， 浮 点 
数 是 不 具备 “全 序 关 系 ”(total order) 的 。 关 于 “全 序 ” 和 “ 偏 序 ”的 问题 ， 
本 节 就 不 展开 讲解 了 ， 后 面 讲 到 trait 的 时 候 ， 再 给 大 家 介绍 PartialOrd 和 和 
Ord 这 两 个 trait。 


2.2.6 ”指针 类 型 


无 GC 的 编程 语言 ， 如 C、C++ 以 及 Rust， 对 数据 的 组 织 操作 有 更 多 
的 自由 度 ， 具 体 表现 为 : 


同一 个 类 型 ， 茶 些 时候 可 以 指定 它 在 栈 上 ， 茶 些 时 候 可 以 指定 它 
在 扒 上 。 内 存 分 配方 式 可 以 取决 于 使 用 方式 ， 与 类 型 本 身 无 藉 。 


既 可 以 直接 访问 数据 ， 也 可 以 通过 指针 间接 访问 数据 。 可 以 针对 
任何 一 个 对 象 取得 指 网 它 的 指针 。 

















既 可 以 在 复合 数据 类 型 中 直接 嵌入 别 的 类 型 的 实体 ， 也 可 以 使 用 
指针 ， 间 接 指 向 别 的 类 型 。 


.甚至 可 能 在 复合 数据 类 型 末尾 睦 入 不 定 长 数据 构造 出 不 定 长 的 复 
合 数据 类 型 。 
Rust 里 面 也 有 指针 类 型 ， 而 且 不 止 一 种 指针 类 型 。 常 见 的 几 种 指针 
类 型 见 表 2-2。 
表 22 


类 型 名 简介 

Box<T> 指向 类 型 工 的 、 具 有 所 有 权 的 指针 ， 有 权 释 放 内 存 

&T 指向 类 型 T 的 借用 指针 ,也 称 为 引用 ,无 权 释 放 内 存 ， 无 权 写 数 据 
&mut T 指向 类 型 的 mut 型 借用 指针 ， 无 权 释放 内 存 ， 有 权 写 数据 
*const T 指向 类 型 T 的 只 读 裸 指针 ， 没 有 生命 周期 信息 ， 无 权 写 数据 

*mut T 指向 类 型 T 的 可 读 写 裸 指针 ， 没 有 生命 周期 信息 ， 有 权 写 数据 


除 此 之 外 ， 在 标准 库 中 还 有 一 种 封 梁 起 来 的 可 以 当 作 指针 使 用 的 关 
型 ， 叫 “智能 指针 ”(smart pointer) 。 常 见 的 智能 指针 见 表 2-3。 


表 2-3 


类 型 名 简介 
Rc<T> 指向 类 型 T 的 引用 计数 指针 ， 共 享 所 线程 不 安全 
Arc<T> 指向 类 型 T 的 原子 型 引用 计数 指针 ， 共 享 所 有 权 ， 线 程 安 全 
Cow<’a, T> Clone-on-write， 写 时 复制 指针 。 可 能 ) ! 全] 上 指针 ， 也 可 能 是 具有 所 有 权 的 指针 


有 关 这 几 种 指针 的 使 用 方法 和 设计 原理 ， 请 参见 本 书 第 二 部 分 。 


2.2.7 ”类 型 转换 


Rust 对 不 同类 型 之 间 的 转换 控制 得 非常 严格 。 即 便 是 下 面 这 样 的 程 
序 ， 也 会 出 现 编译 错误 : 








fn main() { 
Jet Var1 : i8 = 41; 
let var2 : i16 = varil; 





编译 结果 为 mismatched types! i8 类 型 的 变量 竟然 无 法 向 计 6 类 型 的 
变量 赋值 ! 这 可 能 对 很 多 用 户 来 说 都 是 一 个 意外 。 


Rust 提 供 了 一 个 关键 字 as， 专 门 用 于 这 样 的 类 型 转换 : 





fn main() { 
Jet var1 : i8 = 41; 
let var2 : 116 = varl1 as i16; 


} 





也 就 是 说 ，Rust 设 计 者 希望 在 发 生 类 型 转换 的 时 候 不 是 偷偷 摸 摸 进 
行 的 ， 而 是 显 式 地 标记 出 来 ， 防 止 隐藏 的 bug。 虽 然 在 许多 时 候 会 让 代 
码 显得 不 那么 精简 ， 但 这 也 算是 一 种 合理 的 折 中 。 


as 关 键 字 也 不 是 随便 可 以 用 的 ， 它 只 允许 编译 俐 认为 合理 的 类 型 转 
换 。 任 意 类 型 转换 是 不 允许 的 : 











let a = "some string"; 
let b = a as u32; // 编译 错误 








有 些 时 候 ， 甚 至 需要 连续 写 多 个 as 才 能 转 成 功 ， 比 如 &i32 类 型 就 不 
能 直接 转换 为 xmut i32 类 型 ， 必 须 像 下 面 这 样 写 才 可 以 : 





fn main() { 
let i = 42; 
// 先 转 为 *const i32, 再 转 为 *mut i32 
let p = &i as *const i32 as *mut i32; 
printlin!("{:p}", p); 




















} 





as 表 达 式 允许 的 类 型 转换 如 表 2-4 所 示 。 对 于 表达 式 e as U，e 是 表达 
式 ，U 是 要 转换 的 目标 类 型 ， 表 2-4 中 所 示 的 类 型 转换 是 允许 的 。 


表 2-4 


Type of e U 


Integer or Float type Integer or Float type 
C-like enum Integer type 

bool or char Integer type 

u8 char 

*T *Vwhere V: Sized* 


*T where T: Sized | Numeric type 


Integer type *V where V: Sized 
&. | ny *const TI 

Function pointer *V where V: Sized 
Function pointer Integer 


如 末 需 要 更 复杂 的 类 型 转换 ， 一 般 是 使 用 标准 库 的 From Into 等 


trait， 请 参见 第 26 章 。 








2.3 ”复合 数据 类 型 


复合 数据 类 型 可 以 在 其 他 类 型 的 基础 上 形成 更 复杂 的 组 合 关 系 。 


本 章 介 绍 tuple、struct、enum 等 几 种 复合 数据 类 型 。 数 组 留 到 第 6 章 
小 ED o 


2.3.1 tuple 





tuple 指 的 是 “元 组 ”类 型 ， 它 通过 圆 括号 包含 一 组 表达 式 构成 。tuple 
内 的 元 素 没有 名 字 。tuple 是 把 几 个 类 型 组 合 到 一 起 的 最 简单 的 方式 。 比 
如 : 





















































let a = (1i32, false); // 元 组 中 包含 两 个 元 素 , 第 一 个 是 132 类 型 ,第 二 个 是 boo1 类 型 
let b = ("a", (1i32, 2i32)); // 元 组 中 包含 两 个 元 素 ,第 二 个 元 素 本 身 也 是 元 组 , 它 又 包含 了 F 




















如 果 元 组 中 只 包含 一 个 元 素 ， 应 该 在 后 面 添加 一 个 人 巡 号 ， 以 区 分 括 
号 表达 式 和 元 组 : 








let a 
let b 


(0, ); // a 是 一 个 元 组 , 它 有 一 个 元 素 
(0); // b 是 一 个 括号 表达 式 , 它 是 i132 类 型 








访问 元 组 内 部 元 素 有 两 种 方法 ， 一 种 是 “模式 罗 配 ”(pattern 
destructuring) ， 另 外 一 种 是 “数字 索引 ?”: 





let p = (1i32, 2i32); 
let (a, b)= p; 


let x = 
Jet y = 
printlnl 


p.0; 
p.1; 
("{} {} {} {}", a, b, x, y); 











在 第 7 章 中 会 对 “模式 匹配 ”做 详细 解释 。 
元 组 内 部 也 可 以 一 个 元 素 都 没有 。 这 个 类 型 单独 有 一 个 名 字 ， 叫 


unit (单元 类 型 ) : 





Jet empty : () = (); 





可 以 说 ，unit 类 型 是 Rust 中 最 简单 的 类 型 之 一 ， 也 是 占用 空间 最 小 
的 类 型 之 一 。 空 元 组 和 空 结构 体 struct Foo; 一 样 ， 都 是 占用 0 内 存 空 
间 。 





fn main() { 
println!("size of i8 {}" , std::mem::size of::<i8>()); 
println!("size of char {}" , std::mem::size_of::<char>()); 
println!("size of '()' {}" , std::mem::size of::<()>()); 





上 面 的 程序 中 ，std: : mem: : size_of 函 数 可 以 计算 一 个 类 型 所 占 
用 的 内 存 空间 。 可 以 看 到 ，i8 类 型 占用 1 byte，char 类 型 占用 4 bytes， 空 
元 组 占用 0 byte。 


与 C++ 中 的 空 类 型 不 同 ，Rust 中 存在 实打实 的 0 大 小 的 类 型 。 在 
C++ 标准 中 ， 有 明确 的 规定 ， 是 这 么 说 的 : 





Complete objects and member subobjects of class type shall have 
nonzero size. 





class Empty {}; 
Empty emp; 
assert(sizeof(emp) != 0); 





2.3.2 struct 


结构 体 〈struct) 与 元 组 类 似 ， 也 可 以 把 多 个 类 型 组 合 到 一 起 ， 作 
为 新 的 类 型 。 区 别 在 于 ， 它 的 每 个 元 素 都 有 目 己 的 名 字 。 举 个 例子 : 














Struct Point { 
x: i32, 
y: 1i32, 

} 











每 个 元 素 之 间 采 用 逗号 分 开 ， 最 后 类 型 依 
旧 跟 在 冒 恕 后 面 ， 但 是 不 能 使 用 自动 类 型 推导 功能 ， 必 须 显 式 指定 。 
和 使 用 “成 员 CO 值 ” 的 格 
I\o 











fn main() { 
let p = Point { x: 0, y: 0}; 
println!("Point is at {} {}", p.x, p.y); 





有 些 时 候 ， Rust 允 许 struct 类 型 的 初始 化 使 用 一 种 简化 的 写法 。 
RR 名 字 和 成 员 变 量 名 字 愉 好 一 致 ， 那 么 可 以 省 略 掉 重 复 的 冒 
初始 化 : 














fn main() { 


// 刚好 局 部 变量 名 字 和 结构 体 成 员 名 字 一 致 
全 





let = 20; 

// 是 简略 写法 ,等 同 于 Point { x: x，y: y }》, 同 名字 的 相对 应 
let ee = Point { x, y }; 

println!("Point is at {} {}", p.x, p.y); 

















访问 结构 体内 部 的 元 素 ， 也 十 使 用 “ 态 * 加 变量 名 的 方式 。 当 然 ， 我 
们 也 可 以 使 用 “模式 匹配 ”功能 





fn main() { 
let p = Point { x: 0, 0}; 
// 声明 了 px 和 py, 分 别 各 直到 成 员 x 和 成 员 y 
Jet Point { x : px y : py } = p; 
println!("Point is at {} {}", px, py); 
// 同 理 , 在 模式 匹配 的 时 候 ， 加 时装 安 最 名 好 和 记 员 各 守 相 了 可 以 使 用 简写 方式 
let point {x,y}= 
A De is at fy {}", x, y); 



































Rnust 设 计 了 一 个 语法 糖 ， 人 允许 用 一 种 简化 的 语法 赋值 使 用 另外 一 个 
struct 的 部 分 成 员 。 比 如 : 





Struct Point3d { 
Xe IZ 
y: i132, 
z: i32, 


} 


fn default() -> Point3d { 
Point3d { x: 0, y: 0, z: 0 } 





// 可 以 使 用 default( ) 函 数 初始 化 其 他 的 元 素 

// . .eXpr 这 样 的 语法 , 只 能 放 在 初始 化 表达 式 中 , 所 有 成 员 的 最 后 最 多 只 能 有 一 个 
let origin = Point3d { x: 5, ..default()}; 

let point = Point3d { z: 1, x: 2, ..origin }; 






































如 前 所 说 ， 与 tuple 类 似 ，struct 内 部 成 员 也 可 以 是 空 : 











// 以 下 三 种 都 可 以 ,内 部 可 以 没有 成 
struct Fool; 

struct Foo2(); 

struct Foo3{} 





pl 














2.3.3 tuple struct 


Rust 有 一 种 数据 类 型 叫 作 tuple struct， 它 就 像 是 tuple 和 struct 的 混 
合 。 区 别 在 于 ，tuple struct 有 和 名字， 而 它们 的 成 员 没 有 名 字 : 





struct Color(i32, i32, i32); 
struct Point(i32, i32, i32); 





它们 可 以 被 想象 成 这 样 的 结构 体 : 





struct Color{ 
0: i32, 
1: i32, 
2: i32, 


struct Point { 
0: i32, 
1: i32, 
2: i32, 








因为 这 两 个 类 型 部 有 自己 的 名 字 ， 虽 然 它 们 的 内 部 结构 是 一 样 的 ， 
但 是 它们 是 完全 不 同 的 两 个 类 型 。 有 时 候 我 们 不 需要 特别 关心 结构 体内 
部 成 员 的 名 字 ， 可 以 采用 这 种 语法 。 





tuple、struct、struct tuple 起 的 作用 都 是 把 几 个 不 同类 型 的 成 员 打 包 
组 合成 一 个 类 型 。 它 们 的 区 别 如 表 2-5 所 示 。 


表 2-5 
类 型 名 称 | tuple | asd | tuple struct 


语法 没 名 字 圆 括号 名 字 加 大 括号 名 字 加 圆 括号 
类 型 名 字 没有 单独 的 名 字 有 单独 的 名 字 有 单独 的 名 字 
成 员 名 字 没有 单独 的 名 字 有 单独 的 名 字 没 单独 的 名 字 


它们 除了 在 取 名 上 有 这 些 区 别 外 ， 没 有 其 他 区 别 。 它 们 有 一 致 的 内 
存 对 齐 策略 、 一 致 的 占用 空间 规则 ， 也 有 类 似 的 语法 。 从 下 面 这 个 例子 
可 以 看 出 它们 的 语法 是 很 一 致 的 : 








// define struct 
struct T1 { 
V: i32 


} 
// define tuple struct 
struct T2(i32); 


fn main() { 


let vi = Ti {v: 1}; 

let v2 = T2(1); // init tuple struct 
let v3 = T2 { 0: 1 }; // init tuple struct 
let i1 = vi.v; 

let i2 = v2.0; 

let i3 = v3.0; 








tuple struct 有 一 个 特别 有 用 的 场景 ， 那 就 是 当 它 只 包含 一 个 元 素 的 
时 候 ， 就 是 所 谓 的 newtype idiom。 因 为 它 实 际 上 让 我 们 非常 方便 地 在 一 
个 类 型 的 基础 上 创建 了 一 个 新 的 类 型 。 举 例如 下 : 








fn main() { 
struct Inches(i32); 


fn fi(value : Inches) 人 0 
fn f2(value : i32) 人 


let v : i32 = 0; 
fi(v); // 编译 不 通过 , 'mismatched types' 
f2(v); 

















ee | 


以 上 程序 编译 不 通过 ， 因 为 Inches 类 型 和 i32 是 不 同 的 类 型 ， 函 数 调 
用 参数 不 匹配 。 


但 是 ， 如 果 我 们 把 以 上 程序 改 一 下 ， 使 用 type alias (类 型 别名 〉 实 
现 ， 那 么 就 可 以 编译 通过 了 : 





fn type_alias() { 
pe I = i32; 


fn fi(v : I) {} 
fn f2(v : i32) 人 


let v : i32 = 0，; 
f1(v); 
f2(v); 





从 上 面 的 讲解 可 以 看 出 ， 通 过 关键 字 type， 我 们 可 以 创建 一 个 新 的 
类 型 名 称 ， 但 是 这 个 类 型 不 是 全 新 的 类 型 ， 而 只 是 一 个 具体 类 型 的 别 
名 。 在 编译 器 看 来 ， 这 个 别名 与 原先 的 具体 类 型 是 一 模 一 样 的 。 而 使 用 
tuple struct 做 包装 ， 则 是 创造 了 一 个 全 新 的 类 型 ， 它 跟 被 包装 的 类 型 不 
能 发 生 隐 式 类 型 转换 ， 可 以 具有 不 同 的 方法 ， 满 足 不同 的 trait， 完 全 按 





2.3.4 enum 


如 果 说 tuple、struct、tuple struct 在 Rust 中 代表 的 是 多 个 类 型 
的 “与 关系， 那么 enum 类 型 在 Rust 中 代表 的 就 是 多 个 类 型 的 “或 ”关系 。 


与 C/C++ 中 的 枚 举 相 比 ，Rust 中 的 enum 要 强大 得 多 ， 它 可 以 为 每 个 
成 员 指 定 附属 的 类 型 信息 。 比 如 说 我 们 可 以 定义 这 样 的 类 型 ， 它 内 部 可 
能 是 一 个 132 型 整数 ， 或 者 是 f32 型 浮 点 数 : 











enum Number { 
Int(i32), 
Float(f32), 





Rust 的 enum 中 的 每 个 元 素 的 定义 语法 与 struct 的 定义 语法 类 似 。 可 
以 像 空 结构 体 一 样 ， 不 指定 它 的 类 型 ， 也 可 以 像 tuple struct 一 样 ， 用 圆 


括号 加 无 名 成 员 ， 还 可 以 像 正常 结构 体 一 样 ， 用 大 括号 加 带 名 字 的 成 
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用 enum 把 这 些 类 型 包含 到 一 起 之 后 ， 就 组 成 了 一 个 新 的 类 型 。 


要 使 用 enum， 一 般 要 用 到 “模式 匹配 ?”。 模 式 匹 配 是 很 重要 的 一 部 
分 ， 用 第 7 章 来 详细 讲解 。 这 里 我 们 给 出 一 个 用 match 语 句 读 取 enum 和 内 部 
数据 的 示例 : 





enum Number { 
Int(i32), 
Float(f32), 


fn read num(num: &Number) { 

match num 
// 如 果 匹 配 到 了 Number::Int 这 个 成 员 , 那么 value 的 类 型 就 是 i32 
&Number': :Int(value) => println!("Integer {}", value), 
// 如 果 [ 匹 配 到 了 Number: :Float 这 个 成 员 , 那么 value 的 类 型 就 是 f32 
&Number: :Float(value) => println!("Float {}", value), 














} 


fn main() { 


let n: Number = Number::Int(10); 
read_num(&n); 





Rust 的 enum 与 C/C++ 的 enum 和 union 都 不 一 样 。 它 是 一 种 更 安全 的 
类 型 ， 可 以 被 称 为 “tagged union”。 从 C 语 言 的 视角 来 看 Rust 的 enum 类 
型 ， 重 写 上 面 这 段 代码 ， 它 的 语义 类 似 这 样 : 





#include <stdio.h> 
#include <stdint.h> 


// C 语言 模拟 Rust 的 enum 
struct Number { 
enum {Int, Float} tag; 
union { 
int32_t int_value; 
float float_value; 
} value; 


了 


void read num(struct Number * num) 区 
switch(num->tag) { 
case Int: 
printf("Integer %d", num->value.int_value); 
break; 
case Float: 
printf("Float %f", num->value.float_value); 


break 
defauilt: 
printf("data error"); 
break; 
} 
} 


int main() { 
struct Number n = { tag : Int, value: { int_value: 10} }; 
read_num(&n); 
return ©; 





Rust 的 enum 类 型 的 变量 需要 区 分 它 里 面 的 数据 究竟 是 哪 种 变 体 ， 所 
以 它 包含 了 一 个 内 部 的 “tag 标 记 ?* 来 描述 当前 变量 属于 哪 种 类 型 。 这 个 标 
记 对 用 户 是 不 可 见 的 ， 通 过 恰当 的 语法 设计 ， 保 证 标记 与 类 型 始终 是 匹 
配 的 ， 以 防止 用 户 错 误 地 使 用 内 部 数据 。 如 果 我 们 用 C 语 言 来 模拟 ， 就 
需要 程序 员 目 己 及 你 证 恋 写 的 时 候 标记 和 数据 艾 琢 是 匹配 的 ， 编译 器 无 
法 自动 检查 。 当 然 ， 上 面 这 个 模拟 只 是 为 了 通俗 地 解释 Rust 的 enum 类 型 
的 基本 工作 原理 ， 在 实际 中 ， enum 的 内 存 布局 未 必 是 这 个 样子 ， 编 译 
髓 有 许多 优化 ， 可 以 保证 语义 正确 的 同时 减少 内 存 使 用 ， 并 加 快 执行 速 
度 。 如 果 是 在 FFI 场 景 下 ， 要 保证 Rust 里 面 的 enum 的 内 存 布 局 和 C 语 言 兼 
容 的 话 ， 可 以 给 这 个 enum 添 加 一 个 #[repr《C，Int) ] 属 性 标签 〈 目 前 这 
个 设计 已 经 通过 ， 但 是 还 未 在 编译 器 中 实现 ) 。 


我 们 可 以 试 着 把 前 面 定 义 的 Number 类 型 占用 的 内 存 空间 大 小 打印 
出 来 看 看 : 























fn main() 
// 使 用 了 泛 型 函数 的 调用 语法 , 请 参考 第 21 章 泛 型 
println!("Size of Number: {}", std::mem::size of::<Number>()); 























println!("Size of i32: {}", std::mem::size of::<i32>()); 
println!("Size of f32: {}", std::mem::size of::<f32>()); 
} 
又 二 /一 
编译 执行 可 见 : 





Size of Number: 8 
Size of i32: 4 
Size of f32: 4 





Number 里 面 要 么 存储 的 是 i32， 要 么 存储 的 是 f32， 它 存储 数据 需要 
的 空间 应 该 是 max (sizeof (i32) ，sizeof (f32) ) =max (4 byte, 4 


byte) =4 byte。 而 它 总 共 占 用 的 内 存 是 8 byte， 多 出 来 的 4 byte 就 是 用 于 
保存 类 型 标记 的 。 之 所 以 用 4byte， 是 为 了 内 存 对 齐 。 


Rust 里 面 也 支持 union 类 型 ， 这 个 类 型 与 C 语 言 中 的 union 完 全 一 致 。 
但 在 Rust 里 面 ， 读 取 它 内 部 的 值 被 认为 是 unsafe 行 为 一般: Ws 
不 使 用 这 种 类 型 。 它 存在 的 主要 目的 是 为 了 方便 与 C 语 言 进行 交互 


在 Rust 中 ，enum 和 struct 为 内 部 成 员 创建 了 新 的 名 字 空 间 。 如 果 要 
访问 内 部 成 员 ， 可 以 使 用 : : 和 符号。 因此， 不 同 的 enum 中 重 名 的 元 素 
也 不 会 互相 冲突 。 例 如 在 下 面 的 程序 中 ， 两 个 枚 举 内 部 都 有 Move 这 个 
成 员 ， 但 是 它们 不 会 有 冲突 。 




















enum Message { 
Quit, 
ChangeColor (i32, i32, i32), 
Move { x: i32, y: i32 }, 
Write(String)， 


Jet x: Message = Message::Move { x: 3, y: 4 }; 


enum BoardGameTurn { 
Move { squares: i32 }, 
Pass， 


} 


let y: BoardGameTurn = BoardGameTurn::Move { squares: 1 }; 








我 们 也 可 以 手动 指定 每 个 变 体 目 己 的 标记 值 : 





fn main() { 
enum Animal 区 


dog = 1, 
cat = 200， 
tiger, 


let x = Animal::tiger as isize; 
println!i("{}", x); 





Rust 标 准 库 中 有 一 个 极其 常用 的 enum 类 型 Option<T>， 它 的 定义 如 





enum Option<T> { 
None, 
Some(T), 








由 于 它 实 在 是 太 常 用 ， 标 准 库 将 Option 以 及 它 的 成 员 Some、None 
都 加 入 到 了 Prelude 中 ， 用 户 甚至 不 需要 use 语 名 声明 就 可 以 直接 使 用 。 
它 表 示 的 含义 是 “要 么 存在 、 要 么 不 存在 ”。 比 如 Option<i32> 表 达 的 意思 
就 是 “可 以 是 一 个 i32 类 型 的 值 ， 或 者 没有 任何 值 ”。 


Rust 的 enum 实 际 上 是 一 种 代数 类 型 系统 (Algebraic Data Type， 
ADT) ， 本 书 第 8 章 简要 介绍 什么 是 ADT。enum 内 部 的 variant 只 是 一 个 
名 字 而 已 ， 恰 好 我 们 还 可 以 将 这 个 名 字 作 为 类 型 构造 器 使 用 。 意 思 是 
说 ， 我 们 可 以 把 enum 内 部 的 variant 当 成 一 个 函数 使 用 ， 示 例如 下 : 








fn main() { 
let arr = [1,2,3,4,5]; 
// 请 注意 这 里 的 map 函 数 
let v: Vec<Option<&i32>> = arr.iter().map(Some).collect(); 
println!("{:?2}", VvV); 








有 关 友 代 器 的 知识 ， 请 各 位 读者 参考 第 24 章 的 内 容 。 在 这 里 想 说 明 
的 问题 是 ，Some 可 以 当成 函数 作为 参数 传递 给 map。 这 里 的 Some 其 实 
是 作为 一 个 函数 来 使 用 的 ， 它 输入 的 是 &i32 类 型 ， 输 出 为 Option<&i32> 
类 型 。 可 以 用 如 下 方式 证 明 Some 确 实 是 一 个 函数 类 型 ， 我 们 把 Some 初 
始 化 给 一 个 unit 变 量 ， 产 生 一 个 编译 错误 : 





fn main() { 
let _ : () = Some; 
} 





编译 错误 是 这 样 写 的 : 





error[E0308]: mismatched types 
--> test.rs:3:18 


3 let : () = Some; 


| 
| 
| AAAA expected (), found fn item 
| 


note: expected type ‘(). 
found type ‘fn(_) -> std::option::Option< > {std::option::0Option< >::Son 





可 见 ，enum 内 部 的 variant 的 类 型 确实 是 函数 类 型 。 


2.3.5 ”类 型 递归 定义 


Rust 里 面 的 复合 数据 类 型 是 允许 递归 定义 的 。 比 如 struct 里 面 铭 套 同 
样 的 struct 类 型 ， 但 是 直接 内 套 是 不 行 的 。 示 例如 下 : 











struct Recursive { 
data: i32, 
rec: Recursive, 


} 





使 用 rustc--crate-type=lib test.rs 命 令 编译 ， 可 以 看 到 如 下 编译 错误 : 





error[E0072]: recursive type “Recursive ”has infinite size 
--> test.rs:2:1 
| 
2 | struct Recursive { 
| AAAAAAAAAAAAAAAA recursive type has infinite size 
3 | data: i32, 
4 | rec: Recursive, 
| ---------- recursive without indirection 
| 


help: insert indirection (e.g., a Box’, Rc’, or ‘& ) at some point to make ‘Re 





以 上 编译 错误 写 得 非常 人 性 化 ， 不 仅 写 清楚 了 错误 原因 ， 还 给 出 了 
可 能 的 修复 办 法 。Rust 是 允许 用 户 手工 控制 内 存 布局 的 语言 。 直 接 使 用 
类 型 递归 定义 的 问题 在 于 ， 当 编译 器 计算 Recursive 这 个 类 型 大 小 的 时 
候 : 








size_of::<Recursive>() == 4 + size_of::<Recursive>() 








这 个 方程 在 实数 范围 内 无 解 。 


I 
定 的 ， 比 如 : 





struct Recursive { 
data: i32, 
rec: Box<Recursive>, 








我 们 把 产生 了 递归 的 那个 成 员 类 型 改 为 了 指针 ， 这 个 类 型 就 非常 合 
于 了 


第 3 草 ”语句 和 表达 式 
语句 和 表达 式 是 Rust 语 言 实现 控制 逻辑 的 基本 单元 。 


3.1 语句 


一 个 Rust 程 序 ， 是 从 main 函 数 开 始 执行 的 。 而 函数 体内 ， 则 是 由 一 


条 条 语句 组 成 的 。 


Rust 程 序 里 ， 表 达 式 (Expression) 和 语句 〈Statement) 是 完成 流 
程控 制 、 计 算 求 值 的 主要 工具 ， 也 是 本 市 要 讲 的 核心 部 分 。 在 Rust 程 序 
里 面 ， 表 达 式 可 以 是 语句 的 一 部 分 ， 反 过 来 ， 语 句 也 可 以 是 表达 式 的 一 
部 分 。 一 个 表达 式 总 是 会 产生 一 个 值 ， 因 此 它 必 然 有 类 型 ， 语 句 不 产生 
值 ， 它 的 类 型 永远 是 〈) 。 如 果 把 一 个 表达 式 加 上 分 号 ， 那 么 它 就 变 成 
了 一 个 语句 ;如 果 把 语句 放 到 一 个 语句 块 中 包 起 来 ， 那 么 它 就 可 以 被 当 
成 一 个 表达 式 使 用 。 








32 雪 达 趣 


在 Rust Reference 中 有 这 样 一 句 话 : 
Rust is primarily an expression language. 


Rust 基 本 上 就 是 一 个 表达 式 语言 。“ 表 达 式 ”在 Rust 程 序 中 占据 着 重 
要 人 位置， 表达 式 的 功能 非常 强大 。Rust 中 的 表达 式 语 法 具有 非常 好 
1 每 种 表达 式 都 可 以 艇 入 到 另外 一 种 表达 式 中 ， 组 成 更 强大 

式 。 


Rust 的 表达 式 包 括 字 面 量 表达 式 、 方 法 调用 表达 式 、 数 组 表达 式 、 
索引 表达 式 、 单 目 运算 符 表达 式 、 双 目 运算 符 表达 式 等 。Rust 表 达 式 又 
可 以 分 为 “ 左 值 ” (lvalue) 和“ 右 值 ”(rvalue 〉 两 类 。 所 谓 左 值 ， 意 思 是 
这 个 表达 式 可 以 表达 一 个 内 存 地 址 。 因 此 ， 它 们 可 以 放 到 赋值 运算 符 左 
边 使 用 。 其 他 的 都 是 右 值 。 














2 过 上 人 也 


Rust 的 算术 运算 符 包 括 : 加 (+)、 减 (-)、 乘 (*)、 除 (0)、 
求 余 (%) ， 示 例如 下 : 


fn main() { 
let x = 100; 


let y = 10; 
printlin!i("{} {XxX+Yy,xX-y,xX*Yy, xXxX/y, x%y); 





在 上 面 例子 中 ，xt+t+y、x-y 这 些 都 是 算术 运算 表达 式 ， 它 们 都 有 自己 
的 值 和 类 型 。 常 见 的 整数 、 浮 点 数 类 型 都 支持 这 几 种 表达 式 。 它 们 还 可 
以 被 重 载 ， 让 上 自 定义 的 类 型 也 支持 这 几 种 表达 式 。 运 算 符 重 载 相关 的 内 
容 会 在 第 26 章 介绍 标准 库 的 时 候 会 详细 说 明 。 

Rust 的 比较 运算 符 包 括 : 等 于 (==) 、 不 等 于 (! =) 、 小 于 


(<) 、 大 于 (>) 、 小 于 等 于 (<=) 、 大 于 等 于 (>=) 。 比 较 运 算 符 
的 两 边 必 须 是 同类 型 的 ， 并 满足 PartialEq 约 束 。 比 较 表 达 式 的 类 型 是 


bool。 另 外 ，Rust 禁 止 连续 比较 ， 示 例如 下 : 





fn f(a: bool, b: bool, c: bool) -> bool { 
a. == == Cc 
} 





编译 时 ， 编 译 器 提示 “连续 比较 运算 符 必须 加 上 括号 ”， 





$ rustc --crate-type rlib test,rs 
error: chained comparison operators require parentheses 
--> test.rs:2:7 


2 | 信号 三 | 恬 ; 三 兰 二 
| 人 AAA 人 AAA 人 人 人 


error: aborting due to previous error 








人 
理解 。 


Rust 的 位 运算 符 具 体 见 表 3-1。 


运算 符 作用 


| 按 位 取 反 (注意 不 是 一 符号 ) 
& 按 位 与 


] 按 位 或 
^ | 按 位 异 或 
<< | 左 移 


~~> 右 移 


示例 如 下 : 





fn main() { 
lJet num1 : u8 = 0b 1010 1010 ， 


let num2 : u8 = 0b_1111 0000 


println1!("{t:08b}"，!num1)， 
println!("{:08b}", num1 & num2 ) ， 
println!("{t:08b}y"，numl | num2); 
println!("{:08b}", numi 人 ^ num2); 
println!("{:08b}", num1 << 4); 
println!("{:08b}", num1 >> 4); 





执行 结果 为 : 





$ ./test 
©01010101 
10100000 
11111010 
©01011010 
10100000 
00001010 





Rust 的 逻辑 运算 符 具 体 见 表 3-2。 


表 3-2 





逻辑 取 反 


取 反 运算 符 既 支持“ 逻辑 取 反 ?也 文 持 “ 按 位 取 反 ”， 它 们 是 同一 个 运 
算 符 ， 根 据 类 型 决定 执行 哪个 操作 。 如 果 被 操作 数 是 bool 类 型 ， 那 么 就 
是 逻辑 取 反 ; 如 果 被 操作 数 是 其 他 数字 类 型 ， 那 么 就 是 按 位 取 反 。 


bool 类 型 既 文 持 “ 过 辑 与 人 “逻辑 或 ?， 也 文 持 “ 按 位 与 “ 按 位 
或 ?。 它 们 的 区 别 在 于 ,“ 远 辑 与 “多 辑 或 ?具备 “短路 功能。 示例 如 
下 ; 








fn f1() -> bool { 
println!("Call f1"); 
true 


} 


fn f2() -> bool { 
println!("Call f2"); 
false 


} 


fn main() { 
println!("Bit and: {}\n", f2() & f1()); 
println!("Logic and: {}\n", f2() && f1()); 


println!("Bit or: {}\n", f1() | f2()); 
println!("Logic or: {}\n", f1() || f2()); 
} 





执行 结果 为 : 





$ ./test 
Call f2 
Call f1 
Bit and: false 


Call f2 
Logic and: false 


Call f1 
Call f2 
Bit or: true 


Call f1 
Logic or: true 





可 以 看 到 ， 所 谓 短路 的 意思 是 : 


:对 于 表达 式 A&&B， 如 果 人 A 的 值 是 false， 那 么 B 就 不 会 执行 求 值 ， 
直接 返回 false。 


:对 于 表达 式 AlIB， 如 果 A 的 值 是 rue， 那么 B 就 不 会 执行 求 值 ， 直 接 


返回 true。 


而 “ 按 位 与 "”、“ 按 位 或 "在 任何 时 候 痢 会 先 执 行 左 边 的 表达 式 ， 再 执 
行 右边 的 表达 式 ， 不 会 省 略 。 


男 外 需要 提示 的 一 点 是 ，Rust 里 面 的 运算 符 优 先 级 与 C 语 言 里 面 的 
运算 符 优 先 级 设置 是 不 一 样 的 ， 有 些 细 微 的 又 别 。 不 过 这 并 不 是 很 重 
要 。 不 论 在 哪 种 编程 语言 中 ， 我 们 都 建议 ， 如 果 碰 到 复杂 一 点 的 表达 
式 ， 尺 量 用 小 括 写 明确 表达 计算 顺序 ， 避 免 依赖 语言 默认 的 运算 符 优 先 























级 。 因 为 不 同 知识 背景 的 程序 员 对 运算 符 优 先 级 顺序 的 记忆 是 不 同 的 。 
3.2.2 ”赋值 表达 式 


一 个 左 值 表达 式 、 赋 值 运算 符 〈=) 和 右 值 表达 式 ， 可 以 构成 一 个 
赋值 表达 式 。 示 例如 下 : 





// 声明 局 部 变量 , 带 mut 修饰 
let mut x : i32 = 1; 








// Xx 是 mut 绑 定 ,所 以 可 以 为 它 重 新 赋值 
X = 2; 








上 例 中 ，x=2 是 一 个 赋值 表达 式 ， 它 末尾 加 上 分 号 ， 才 能 组 成 一 个 
语句 。 赋 值 表达 式 具 有 “副作用 ”， 当 它 执行 的 时 候 ， 会 把 右边 表达 式 的 
值 “复制 或 者 移动 ”(copy or move) 到 左边 的 表达 式 中 。 关 于 复制 和 移 
动 的 语义 区 别 ， 请 参见 第 11 章 的 内 容 。 赋 值 号 左右 两 边 表 达 式 的 类 型 必 
须 一 致 ， 否 则 是 编译 错误 。 

赋值 表达 式 也 有 对 应 的 类 型 和 值 。 这 里 不 是 说 赋值 表达 式 左 操作 数 


或 右 操 作 数 的 类 型 和 值 ， 而 是 说 整个 表达 式 的 类 型 和 值 。Rust 规 定 ， 赋 
值 表 达 式 的 类 型 为 unit， 即 空 的 ttple 〈) 。 示 例如 下 : 














fn main() { 
x= 1; 
let mut y = 2; 
// 注意 这 里 专门 用 括号 括 起 来 了 
let z= (y = x); 
println!i("{:?}", ZzZ); 









































} 


Rust 这 么 设计 是 有 原因 的 ， 比 如 说 可 以 防止 连续 赋值 。 如 果 你 有 
x: i32、y: i32 以 及 z: i32， 那 么 表达 式 z=y=x 会 发 生 编译 错误 。 因 为 变 
量 z 的 类 型 是 i32 但 是 却 用 () 对 它 初始 化 了 ， 编 译 器 是 不 允许 通过 的 。 


C 语 言 允 许 连续 赋值 ， 但 这 个 设计 没有 市 来 任何 性 能 提升 ， 反 而 在 
东 些 场景 下 给 用 户 融 来 了 代码 不 够 清晰 直观 的 麻烦 。 举 个 例子 : 





#include <stdio.h> 


int main() { 
int x = 300; 
char y; 
int Zz; 
z=Yy= x; 
printf("%d %d %d", x, y, Zz); 





在 这 种 情况 下 ， 如 果 变 量 x、y、z 的 类 型 不 一 样 ， 而 且 在 赋值 的 时 
ea 那么 用 户 很 难 一 眼看 出 最 终 变量 z 的 值 是 与 x 相同 ， 还 
是 与 y 相 同 。 


这 个 设计 同样 可 以 防止 把 == 写 成 = 的 错误 。 比 如 ，Rust 规 定 ， 在 if 表 
达 式 中 ， 它 的 条 件 表达 式 类 型 必须 是 bool 类 型 ， 所 以 if x=y{} 这 样 的 代码 
是 无 论 如 何 都 编译 不 过 的 ， 哪 怕 x 和 y 的 类 型 都 是 bool 也 不 行 。 赋 值 表达 
式 的 类 型 永远 是 ) ， 它 无 法 用 于 if 条 件 表达 式 中 。 


Rnust 也 支持 组 合 赋值 表达 式 ，+、-、*、/、9%、 攻 、|、A、<<、>> 这 
几 个 运算 符 可 以 和 赋值 运算 符 组 合成 赋值 表达 式 。 示 例如 下 : 











fn main() { 
let x = 2; 
let mut y = 4; 
y += X/ 


y “= Xx; 
print1in!("{} OQ}", x, y); 





LEFT OP=RIGHT 这 种 写法 ， 舍 义 等 同 于 LEFT=LEFT OP RIGHT。 
所 以 ，y+=x 的 意义 相当 于 y=y+x， 依 此 类 推 。 


Rust 不 支持 ++、-- 运 算 符 ， 请 使 用 +=1、-=1 蔡 代 。 
3.2.3 ”语句 块 表达 式 





在 Rust 中 ， 语 句 块 也 可 以 是 表达 式 的 一 部 分 。 语 句 和 表达 式 的 区 分 
方式 是 后 面 带 不 带 分 号 〈; ) 。 如 果 市 了 分 号， 意味 看 这 是 一 条 语句 ， 
它 的 类 型 是 (〉); 如 果 不 带 分 号 ， 它 的 类 型 就 是 表达 式 的 类 型 。 示 例如 
下 ; 


























/ 语句 块 可 以 是 表达 式 , 注意 后 面 有 分 号 结尾 , x 的 类 型 是 ( ) 
let x : () = { println!("Hello."); }; 


















































// Rust 将 按 顺序 执行 语 句 块 内 的 语句 ， 个 表达 式 类 型 返回 ,y 的 类 型 是 i32 
let y : i32 = { println!("Hello."); 5 }; 

















同 理 ， 在 函数 中 ， 我 们 也 可 以 利用 这 样 的 特点 来 写 返 回 值 : 





fn my_func() -> i32 { 
.blablabla 各 种 语句 
100 
} 








注意 ， 最 后 一 条 表达 式 没有 加 分 号 ， 因 此 整个 语句 块 的 类 型 就 变 成 
了 i32， 刚 好 与 函数 的 返回 类 型 匹配 。 这 种 写法 与 return 100; 语句 的 效 
果 是 一 样 的 ， 相 较 于 retum 语 句 来 说 没有 什么 区 别 ， 但 是 更 条 洁 特 
别 是 用 在 后 面 讲 到 的 闭 包 closure 中 ， 这 样 写 就 方便 轻 量 得 


3.3 if-else 


Rust 中 计 -else 表 达 式 的 作用 是 实现 条 件 分 文 。 计 else 表达 式 的 构成 方 
式 为 : 以 让 关 键 字 开头 ， 后 面 跟 上 条 件 表 达 式 ， 后 续 是 结果 语句 块 ， 最 
后 是 可 选 的 else 块 。 条 件 表达 式 的 类 型 必须 是 bool。 


示例 如 下 : 








fn func(i : i32) -> bool { 


if n<oOf 

print!("{} is negative", n); 
} else if n>0 

print!("{} is positive", n); 
} else { 

print!("{} is zero", nN); 





在 让 语 句 中 ， 后 续 的 结果 语句 块 要 求 一 定 要 用 大 括号 包 起 来 ， 不 能 
省 略 ， 以 便 明 确 指 出 该 证 语句 块 的 作用 范围 。 这 个 规定 是 为 了 避免 “悬空 
else” 导 致 的 bug。 比 如 下 面 这 段 C 代 码 : 





if (conditionl) 
if (condition2) { 


} 
else { 


} 





请 问 ， 这 个 else 分 文 是 与 第 一 个 让 相 匹 配 的 ， 还 是 与 第 二 个 计 相 匹配 
的 呢 ? 从 可 读 性 上 来 说 ， 答 案 是 不 够 明显 ， 容 易 出 bug。 规 定 坟 和 else 后 
面 必须 有 大 括号 ， 可 读 性 会 好 很 多 。 


相反 ， 条 件 表达 式 并 未 强制 要 求 用 小 括号 包 起 来 ， 如果 加 上 小 括 
号 ， 编 译 器 反而 会 认为 这 是 一 个 多 余 的 小 括号 ， 给 出 警告。 


更 重要 的 是 ，if-else 结 构 还 可 以 当 表达 式 使 用 ， 比 如 : 














在 这 里 ， 计 -else 结构 成 了 表达 式 的 一 部 分 。 在 让 和 else 后 面 的 大 括号 
内 ， 最 后 一 条 表达 陈 不 要 加 分 号 ， 这 样 一 来 ， 这 两 个 语句 块 的 类 型 就 都 
古 i32， 与 赋值 运算 符 左边 的 类 型 刚好 匹配 。 所 以 ， 在 Rust 中 ， 没 有 必要 
专门 设计 像 C/C++ 那 样 的 三 元 运算 符 〈? : ) 语法 ， 因 为 通过 现 有 的 设 
计 可 以 轻松 实现 同样 的 功能 。 而 且 笔 者 认为 这 样 的 语法 一 致 性 、 扩 展 
性 、 可 读 性 更 好 。 


如 果 使 用 if-else 作 为 表达 式 ， 那 么 一 定 要 注意 ，if 分 支 和 else 分 支 的 
类 型 必须 一 致 ， 否 则 就 不 能 构成 一 个 合法 的 表达 式 ， 会 出 现 编译 错误 。 
如 果 else 分 文 省 略 掉 了 ， 那 么 编译 器 会 认为 else 分 文 的 类 型 默认 为 〈) 。 
所 以 ， 下 面 这 种 写法 一 定 会 出 现 编译 错误 : 








fn invalid expr(cond: bool) -> i32 { 
if cond { 
42 
} 


} 








编译 器 提示 信息 是 : 





1= note: expected type ` () 
found type “i32° 








这 看 起 来 像 是 类 型 不 匹配 的 错误 ， 实 际 上 是 漏 写 了 else 分 文 造 成 
的 。 如 果 此 处 编译 器 不 报错 ， 放 任 程序 编译 通过 ， 那 么 在 执行 到 else 分 
文 的 时 候 ， 就 只 能 返回 一 个 未 初始 化 的 值 ， 这 在 Rust 中 是 不 允许 的 。 
3.3.1 loop 


在 Rust 中 ， 使 用 loop 表 示 一 个 无 限 死 循环 。 示 例如 下 : 





fn main() { 
let mut count = Qu32,; 
println!("Let's count until infinity!"); 





// 无 限 循 环 
loop { 
count += 1; 
If count == 3 { 
println!("three"); 

















// 不 再 继续 执行 后 面 的 代码 , 跳 转 到 100p 开 头 继续 循环 


continue; 

















println!i("{}", count); 
if count == 5 
printjn!("OK, that's enough"); 





// 跳出 循环 
break 
} 
} 
} 





其 中 ， 我 们 可 以 使 用 continue 和 break 控 制 执行 流程 。continue; 语句 
表示 本 次 循环 内 ， 后 面 的 语句 不 再 执行 ， 直 接 进 入 下 一 轮 循环 。 
break; 语句 表示 跳出 循环 ， 不 再 继续 。 


男 外 ，break 语 句 和 continue 语 句 还 可 以 在 多 重 循 环 中 选择 跳出 到 哪 
一 层 的 循环 。 








fn main() { 
// A counter variable 
let mut m = 1; 
let n = 1; 


'a: loop { 
if m < 100 { 


printlin!("break"); 
break 'a; 

} else { 
continue 'a; 





我 们 可 以 在 loop while for 循 环 前 面 加 上 “生命 周期 标识 符 ”。 该 标识 
符 以 单 引 号 开头 ， 在 内 部 的 循环 中 可 以 使 用 break 语 句 选择 跳出 到 哪 一 
二 


与 ff 结构 一 样 ，loop 结 构 也 可 以 作为 表达 式 的 一 部 分 。 





fn main() { 
let v = loop { 
break 10; 


}; 
printlin!i("{}", Vv); 





在 loop 内 部 break 的 后 面 可 以 跟 一 个 表达 式 ， 这 个 表达 式 就 是 最 终 的 
loop 表 达 式 的 值 。 如 果 一 个 loop 永 远 不 返回 ， 那 么 它 的 类 型 就 是 “发 散 类 
型 >。 示 例如 下 : 








fn main() { 
let v = loop {0}; 
println!i("{}", Vv); 





编译 器 可 以 判断 出 v 的 类 型 是 发 散 类 型 ， 而 后 面 的 打印 语句 是 永远 
不 会 执行 的 死 代码 。 


3.3.2 while 


while 语 句 是 带 条 件 判 断 的 循环 语句 。 其 语法 是 while 关 键 字 后 跟 条 
件 判断 语句 ， 最 后 是 结果 语句 块 。 如 果 条 件 满足 ， 则 持续 循环 执行 结果 
语句 块 。 示 例如 下 : 





fn main() { 
// A counter variable 
Jet mut n = 1; 
// Loop while ‘n. is less than 101 
while n < 101 { 
if n% 15 == 0 { 
println!("fizzbuzz"); 
} else if n%3 ==01{ 
println!("fizz"); 
} else if n%5 ==0f{ 
println!("buzz"); 
} else { 
println!("{}", nNn); 


// Increment counter 
n += 1; 





同 理 ，while 语 句 中 也 可 以 使 用 continue 和 break 来 控制 循环 流程 。 


看 到 这 里 ， 读 者 可 能 会 产生 疑惑 : loop{} 和 while true{} 循 环 有 什么 
为 什么 Rust 专 门 设计 了 一 个 死 循环 ，loop 语 句 难 道 不 是 完全 多 余 
J 吗 ? 


实际 上 不 是 。 主 要 原因 在 于 ， 相 比 于 其 他 的 许多 语言 ，Rust 语 言 要 
做 更 多 的 静态 分 析 。loop 和 while true 语 句 在 运行 时 没有 什么 区 别 ， 它 们 
主要 是 会 影响 编译 器 内 部 的 静态 分 析 结 果 。 比 如 : 








let x; 
loop { x = 1; break; } 
println!("{}", x) 





以 上 语句 在 Rust 中 完全 合理 。 因 为 编译 器 可 以 通过 流程 分 析 推 理 出 
x=1; 必然 在 printin! 之 前 执行 过 ， 因 此 打印 变量 x 的 值 是 完全 合理 的 。 
而 下 面 的 代码 是 编译 不 过 的 : 





lJet x; 
while true { x = 1; break; } 
println!("{}", x); 





因为 编译 右 会 觉得 while 语 句 的 执行 跟 条 件 表达 式 在 运行 阶段 的 值 
有 关 ， 因 此 它 不 确定 x 是 否 一 定 会 初始 化 ， 于 是 它 决定 给 出 一 个 错误 : 
use of possibly uninitialized variable， 也 就 是 说 变量 x 可 能 没有 初始 化 。 





3.3.3 for 循环 


Rust 中 的 for 循 环 实际 上 是 许多 其 他 语言 中 的 for-each 循 环 。Rust 中 没 
有 类 似 C/C++ 的 三 段 式 for 循 环 语句 。 举 例如 下 : 





fn main() { 
let array = &[1,2,3,4,5]; 


for i in array { 
println!("The number is {}", i); 





for 循 环 的 主要 用 处 是 利用 迭代 器 对 包含 同样 类 型 的 多 个 元 素 的 容器 
执行 遍历 ， 如 数组 、 链 表 、HashMap、HashSet 等 。 在 Rust 中 ， 我 们 可 以 





3 自己 的 容器 和 迭代 器 ， 因 此 也 很 容易 使 for 循 环 也 支持 自 定义 
-六 生 。 

for 循 环 内 部 也 可 以 使 用 continue 和 break 控 制 执行 
有 关 for 循 环 的 原理 以 及 迭代 器 相关 内 容 


， 参 见 第 24 章 。 


第 4 章 ” 函 数 


4.1 简介 





Rust 的 函数 使 用 关键 字 甸 开头。 函数 可 以 有 一 系列 的 输入 参数 ， 还 
有 一 个 返回 类 型 。 函 数 体 包含 一 系列 的 语句 〈 或 者 表达 式 ) 。 函 数 返 回 
可 以 使 用 returm 语 句 ， 也 可 以 使 用 表达 式 。Rnust 编 写 的 可 执行 程 序 的 入 
口 就 是 fn main〈() 函数 。 以 下 是 一 个 函数 的 示例 : 











fn addi(t : (i32,i32)) -> i32 { 
t.0 + t.1 
} 


这 个 函数 有 一 个 输入 参数 ， 其 类 型 是 tuple (i32，i32) 。 它 有 一 个 
返回 值 ， 返 回 类 型 是 i32。 函数 的 参数 列表 与 let 语 句 一 样 ， 世 是 一 个 “ 模 
0 模式 结构 的 详细 解释 请 参考 第 7 章 。 上 述 函 数 也 可 以 写成 下 面 
这 样 : 








fn add2((x,y) : (i32,i32)) -> i32 { 
Xx+y 
} 


函数 体内 部 是 一 个 表达 式 ， 这 个 表达 式 的 值 就 是 函数 的 返回 值 。 也 
可 以 写 return x+y; 这 样 的 语句 作为 返回 值 ， 效 果 是 一 样 的 。 

函数 也 可 以 不 写 返 回 类 型 ， 在 这 种 情况 下 ， 编 译 器 会 认为 返回 类 型 
是 unit () 。 此 处 和 表达 式 的 规定 是 一 致 的 。 


函数 可 以 当成 头等 公民 (first class value) 被 复制 到 一 个 值 中 ， 这 
个 值 可 以 像 函 数 一 样 被 调用 。 示 例如 下 : 





fn main() { 
let p = (1, 3); 


// func 是 一 个 局 部 变量 
Jet func = add2 
// func 可 以 被 当成 普通 函数 样 被 调用 
































println!("evaluation output {}", func(p)); 








在 Rust 中 ， 每 一 个 函数 都 具有 目 己 单独 的 类 型 ， 但 是 这 个 类 型 可 以 
目 动 转换 到 和 类型。 示例 如 下 : 








fn main() { 
// 先 让 func 指向 add1 
let mut func = add1， 
// 再 重新 赋值 ,让 func 指向 add2 
func = add2; 








编译 ， 会 出 现 编译 错误 ， 如 下 : 





error[E0308]: mismatched types 
--> test.rs:11:12 
| 
11 | func = add2; 
| AAAA expected fn item, found a different fn item 
| 


note: expected type ‘fn((i32, i32)) -> i32 {add1i}. 
found type ‘fn((i32, i32)) -> i32 {add2}. 





虽然 add1 和 add2 有 同样 的 参数 类 型 和 同样 的 返回 值 类 型 ， 但 它们 是 
不 同类 型 ， 所 以 这 里 报错 了 。 修 复方 案 是 让 func 的 类 型 为 通用 的 血 类 型 
即 可 : 
































// 写法 一 ,用 as 类 型 转换 
let mut func = add1l as fn((i32,1i32))->i32; 
// 写法 二 ,用 显 式 类 型 标记 














let mut func : fn((i32,i32))->i32 = addi; 





以 上 两 种 写法 都 能 修复 上 面 的 编译 错误 。 但 是 ， 我 们 不 能 在 参数 、 
返回 值 类 型 不 同 的 情况 下 作 类 型 转换 ， 比 如 : 





fn add3(x: i32, y: i32) -> i32 { 
x+y 


fn main() { 
let mut func : fn((i32,1i32))->i32 = addi; 
func = add2; 
func = add3; 





这 里 再 加 了 一 个 add3 函 数 ， 它 接受 两 个 i132 参数， 这 就 跟 add1 和 add2 
有 了 本 质 区 别 。add1 和 add2 是 一 个 参数 ， 类 型 是 tuple 包 含 两 个 132 成 员 ， 
而 add3 是 两 个 132 参 数 。 三 者 完全 不 一 样 ， 它 们 之 间 是 无 法 进行 类 型 转 
换 的。 


男 外 需要 提示 的 就 是 ，Rust 的 函数 体内 也 允许 定义 其 他 item， 包 括 
静态 变量 、 常 量 、 函 数 、trait、 类 型 、 模 块 等 。 比 如 : 

















fn test_inner() { 
static INNER_STATIC: i64 = 42; 


// 函数 内 部 定义 的 函数 
fn internal_incr(x: i64) -> i64 { 
X7 小 “于 


} 


struct InnerTemp(i64); 


impl InnerTemp { 
fn incr(&mut self) { 
self.0 = internal_ incr(self.0); 
} 
} 


// 函数 体 ,执行 语句 

let mut t = InnerTemp(INNER_STATIC); 
t.incr(); 

println!i("{}", t.0); 





当 你 需要 一 些 item 仪 在 此 函数 内 有 用 的 时 候 ， 可 以 把 它们 下 接 定 义 
到 函数 体内 ， 以 避免 污染 外 部 的 命名 空间 。 


4.2 ”发散 函 数 


Rust 支 持 一 种 特殊 的 发 散 函 数 (Diverging functions) ， 它 的 返回 类 
型 是 感叹 号 ! 。 如 果 一 个 函数 根本 就 不 能 正常 返回 ， 那 么 它 可 以 这 样 
写 : 





fn diverges() -> ! 
panic!("This function never returns!"); 





因为 panic! 会 直接 导致 栈 展 开 ， 所 以 这 个 函数 调用 后 面 的 代码 都 不 
会 继续 执行 ， 它 的 返回 类 型 就 是 一 个 特殊 的 ! 符号 ， 这 种 函数 也 叫 作 发 
0D: 





let x : i32 = diverges(); 
let y : String = diverges(); 





我 们 为 什么 需要 这 样 的 一 种 返回 类 型 呢 ? 先 看 下 面 的 例子 : 





let p= if x { 
panic! ("error"); 
} else { 
100 


}; 





上 面 这 条 语句 中 包含 一 个 if-else 分 文 结构 的 表达 式 。 我 们 知道 ， 对 
于 分 文 结构 的 表达 式 ， 它 的 每 条 分 文 的 类 型 必须 一 怪 。 那 么 这 条 panic! 
宏 应 该 生成 一 个 什么 类 型 呢 ? 这 就 是 ! 类 型 的 作用 了 。 因 为 它 可 以 与 任 
意 类 型 相 容 ， 所 以 编译 器 的 类 型 检查 才能 通过 。 


在 Rust 中 ， 有 以 下 这 些 情况 永远 不 会 返回 ， 它 们 的 类 型 就 是 ! 。 


:panic! 以 及 基于 它 实 现 的 各 种 函数 / 宏 ， 比 如 unimplemented! 、 
unreachable! ; 








: 死 循环 loop{}; 


:进程 退出 函数 std: : process: : exit 以 及 类 似 的 libc 中 的 exec 一 类 
函数 。 


有 类 型 ， 第 8 章 在 对 类 型 系统 做 更 深入 分 析 的 时 候 还 会 再 
是 到 。 





4.3 _ main 函数 


在 大 部 分 a a 
列 的 参数 ， 退 出 的 时 候 也 可 以 返回 一 个 错误 码 。 Me 
ai 基数 设计 子 参 改 和 返回 值 类 型 以 C 洁 言 为 例 函数 的 原型 一 般 
允许 定义 成 以 下 几 种 形式 : 





int main(void); 
int main(); 


int main(int argc, char **argv); 
int main(int argc, char *argv[]); 
int main(int argc, char **argv, char **env); 





Rust 的 设计 稍微 有 点 不 一 样 ， 传 递 参数 和 返回 状态 码 都 由 单独 的 
API 来 完成 ， 示 例如 下 : 





fn main() { 
for arg in std::env::args() { 
println!("Arg: {}", arg); 
} 


std::process: :exit(0); 


} 





编译 ， 执 行 并 携带 几 个 参数 ， 可 以 看 到 : 





$ test -opt1 opt2 -- opt3 
Arg: test 

Arg: -opt1 

Arg: opt2 

Arg: -- 

Arg: opt3 





每 个 被 空格 分 开 的 字符 串 都 是 一 个 参数 。 进 程 可 以 在 任何 时 候 调 用 
exit〈) 直接 退出 ， 退 出 时 候 的 错误 码 由 exit 〈) 函数 的 参数 指定 。 


如 果 要 读 取 环境 变量 ， 可 以 用 std: : env: : var () 及 std: : 
env: : Vars() 函数 获得 。 示 例如 下 : 


| 
fn main() { 
for arg in std::env::args() { 
match std::env::var(&arg) { 
Ok(val) => printin!("{}: {:?}", &arg, val), 
Err(e) => println!("couldn't find environment {}, {}", &arg, e), 


} 


println!("All environment varible count {}", std::env::vars().count()); 





Var() 图 数 可 以 接受 一 个 字符 串 类 型 参数 ， 用 于 碍 找 当前 环境 变 
量 中 是 否 存在 这 个 名 字 的 环境 变量 ，vars 〈) 函数 不 携带 参数 ， 可 以 返 
回 所 有 的 环境 变量 。 


此 前 ，Rust 的 main 了 水 数 只 支持 无 参数 、 无 返回 值 类 型 的 声明 方式 ， 
即 main 函 数 的 签名 固定 为 : main() -> () 。 但 是 ， 在 引入 了 ? 符号 
作为 错误 处 理 语法 糖 之 后 ， 束 变 得 不 那么 优雅 了 ， 因 为 ? 符号 要 求 当 前 
所 在 的 函数 返回 的 是 Result 类 型 ， 这 样 一 来 ， 问 号 束 无 法 直接 在 main 函 
数 中 使 用 了 。 为 了 解决 这 个 问题 ，Rust 设 计 组 扩展 了 main 函 数 的 签名 ， 
使 它 变 成 了 一 个 泛 型 函数 ， 这 个 冰 数 的 返回 类 型 可 以 是 任何 一 个 满足 
Terminationtrait 约 束 的 类 型 ， 其 中 () 、bool、Result 都 是 满足 这 个 约束 
的 ， 它 们 都 可 以 作为 main 函 数 的 返回 类 型 。 关 于 这 个 问题 ， 可 以 参见 第 
33 章 。 














4.4 const fn 


函数 可 以 用 const 关 键 字 修饰 ， 这 样 的 函数 可 以 在 编译 阶段 被 编译 右 
执行 ， 返 回 值 也 被 视 为 编译 期 常量 。 示 例如 下 : 











#![feature(const_fn)] 


const fn cube(num: usize) -> usize { 
num * num * num 

} 

fn main() { 
const DIM : usize = cube(2); 
const ARR : [i32; DIM] = [0; DIM]; 


println!("{:?}", ARR); 





cube 孙 数 接受 数字 参数 ， 它 会 运 四 一 个 数学 ， 而 且 这 个 返回 值 本 身 
可 以 用 于 给 一 个 const 常 量 做 初始 化 ，const 常 量 又 可 以 当成 一 个 常量 数 
组 的 长 度 使 用 。 


const 函 数 是 在 编译 阶段 执行 的 ， 因 此 相 比 普通 函数 有 许多 限制 ， 并 
非 所 有 的 表达 式 和 语句 都 可 以 在 其 中 使 用 。 鉴 于 目前 这 个 功能 还 没有 完 
全 稳定 ，const 阔 数 具 体 有 哪些 限制 规则 ， 本 书 束 不 在 此 问题 上 详细 展开 
了 ， 后 面 也 许 还 会 有 调整 。 


4.5” 冰 数 如 归 调 用 


Rust 人 允许 函数 递归 调用 。 所 谓 递归 调用 ， 指 的 是 函数 直接 或 者 间接 
调用 自己 。 下 面 用 经 典 的 Fibonacci 数 列 来 举例 : 








fn fib(index: U32) -> u64 { 
if index == 1 || index == 2 { 
1 


} else { 
fib(index - 1) + fib(index - 2) 


} 
fn main() { 
let f8 = fib(8); 
println!("{}", f8); 
} 


0 函数 ， 因 为 在 它 的 函数 体内 又 调用 
了 电 目 己 ， 


谈 到 递归 调用 ， 许 多 读者 都 会 目 然 联想 到 “ 尾 递 归 优 化 ?这 个 概念 。 
可 惜 的 是 ， 当 前 版 本 的 Rust 暂 时 还 不 支持 尾 递 归 优 化 ， 因 此 如 果 弟 归 调 
用 层次 太 多 的 话 ， 是 有 可 能 撑 爆 栈 空间 的 。 不 过 这 个 问题 已 经 在 设计 讨 
论 之 中 ， 各 位 读者 可 以 从 最 新 的 RFC 项 目 中 了 解 进度 。 


第 5 章 trait 


Rust 语 言 中 的 trait 是 非常 重要 的 概念 。 在 Rust 中 ，trait 这 一 个 概念 承 
担 了 多 种 职责 。 在 中 文 里 ，trait 可 以 翻译 为 “特征 ”特点 ”特性 等。 由 
于 这 些 词 区 分 度 并 不 明显 ， 在 本 书 中 一 律 不 翻译 trait 这 个 词 ， 以 避免 歧 


trait 中 可 以 包含 ! 函数 、 常 量 、 类 型 等 。 


5.1 成 员 方法 


trait 中 可 以 定义 函数 。 用 例子 来 说 明 ， 我 们 定义 如 下 的 trait: 





trait Shape { 
fn area(&self) -> f64; 








上 面 这 个 trait 包 舍 了 一 个 方法 ， 这 个 方法 只 有 一 个 参数 ， 这 个 &self 
参数 是 什么 意思 呢 ? 


所 有 的 trait 中 都 有 一 个 隐藏 的 类 型 Self (大 写 S) ， 代 表 当 前 这 个 实 

现 了 此 trait 的 具体 类 型 。trait 中 定义 的 函数 ， 也 可 以 称 作 关联 函数 

(associated function ) 。 函 数 的 第 一 个 参数 如 果 是 Self 相 关 的 类 型 ， 且 
命名 为 self〈 小 写 S) ， 这 个 参数 可 以 被 称 为 "receiver” (接收 者 ) 。 具 有 
receiver 参 数 的 函数 ， 我 们 称 为 “方法 ”(method) ， 可 以 通过 变量 实例 使 
用 小 数 点 来 调用 。 没 有 receiver 人 参数 的 函数 ， 我 们 称 为 “静态 函 
数 ”(static function) ， 可 以 通过 类 型 加 双 冒 号 : : 的 方式 来 调用 。 在 
Rust 中 ， 疯 数 和 方法 没有 本 质 区 别 。 


Rust 中 Self (大 写 S) 和 self (小 写 s) 都 是 关键 字 ， 大 写 $ 的 是 类 型 
名 ， 小 写 s 的 是 变量 名 。 请 大 家 一 定 注 意 区 分 。self 参 数 同样 也 可 以 指定 
类 型 ， 当 然 这 个 类 型 是 有 限制 的 ， 必 须 是 包装 在 Self 类 型 之 上 的 类 型 。 
对 于 第 一 个 self 参 数 ， 常 见 的 类 型 有 self: Self、self: &Self、self: &mut 
Self 等 类 型 。 对 于 以 上 这 些 类 型 ，Rust 提 供 了 一 种 简化 的 写法 ， 我 们 可 
以 将 参数 简写 为 selff、&self、&mut self。self 参 数 只 能 用 在 第 一 个 参数 的 
位 置 。 请 注意 “变量 self? 和 “类 型 Self” 的 大 小 写 不 同 。 示 例如 下 : 





























trait T { 
fn methodi(self: Self); 
fn method2(self: &Self); 
fn method3(self: &mut Self); 








} 
// 上 下 两 种 写法 是 完全 一 样 的 
trait T { 
fn method1(self); 
fn method2(&self ); 
fn method3(&mut self); 








} 





所 以 ， 回 到 开始 定义 的 那个 Shape trait， 上 面 定 义 的 这 个 area 方 法 的 
参数 的 名 字 为 self， 它 的 类 型 是 &Self 类 型 。 我 们 可 以 把 上 面 这 个 方法 的 
声明 看 成 : 





trait Shape { 
fn area(self: &Self) -> f64; 











我 们 可 以 为 菜 些 具体 类 型 实现 〈impl) 这 个 trait。 
假如 我 们 有 一 个 结构 体 类 型 Circle， 它 实现 了 这 个 trait， 代 码 如 下 : 





struct Circle { 
radius: f64, 
} 


impl Shape for Circle { 
// Self 类 型 就 是 Circle 
// self 的 类 型 是 &Self, 即 &Circle 
fn area(&self) -> f64 { 
// 访问 成 员 变 量 , 需要 用 self.radius 
std::f64::consts::PI * Self.radius * self.radius 








} 
} 


fn main() { 
let c = Circle { radius : 2f64}; 
// 第 一 个 参数 名 字 是 self, 可 以 使 用 小 数 点 语法 调用 
println!("The area is {}", c.areal()); 





















































在 上 面 的 例子 中 可 以 看 到 ， 如 果 有 一 个 Circle 类 型 的 实例 c， 我 们 就 
可 以 用 小 数 点 调用 函数 ，c.area () 。 在 方法 内 部 ， 我 们 可 以 通过 
self.radius 的 方式 访问 类 型 的 内 部 成 员 。 


另外 ， 针 对 一 个 类 型 ， 我 们 可 以 直接 对 它 impl 来 增加 成 员 方 法 ， 无 
须 trait 名 字 。 比 如 : 








impl Circle { 
fn get_radius(&self) -> f64 { self.radius } 





我 们 可 以 把 这 段 代 码 看 作 是 为 Circle 类 型 impl1 了 一 个 匿名 的 trait。 用 


这 种 方式 定义 的 方法 叫 作 这 个 类 型 的 “内 在 方法 ”(inherent methods) 。 


trait 中 可 以 包含 方法 的 默认 实现 。 如 果 这 个 方法 在 trait 中 己 经 有 了 
0 那么 在 针对 具体 类 型 实现 的 时 候 ， 就 可 以 选择 不 用 重 写 。 当 
从 ， 如 果 需 要 针对 特殊 类 型 作 特 殊 处 理 ， 也 可 以 选择 重新 实现 
0 比如 ， 在 标准 库 中 ， 和 迭代 吉 Iterator 这 个 
trait 中 束 包 侣 了 十 多 个 方法 ， 但 是 ， 其 中 只 有 fn next (&mut self) - 
>Option<Self: : Item> 是 没有 默认 实现 的 。 其 他 的 方法 均 有 其 默认 实 
现 ， 在 实现 迭代 器 的 时 候 只 需 挑 选 需要 重 写 的 方法 来 实现 即 可 。 


self 参 数 甚 至 可 以 是 Box 指 针 类 型 self: Box<Self>。 另 外 ， 目 前 Rust 
设计 组 也 在 考虑 让 self 变 量 的 类 型 放 得 更 宽 ， 人 允许 更 多 的 自 定 义 类 型 作 
为 receiver， 比 如 MyType<Self> 。 示 例如 下 : 








trait Shape { 
fn area(self: Box<Self>) -> f64; 


struct Circle { 
radius: f64, 


} 


impl Shape for Circle { 
// Self 类 型 就 是 Circle 
// self 的 类 型 是 Box<Self>, 即 Box<Circle> 
fn area(self : Box<Self>) -> f64 { 
// 访问 成 员 变 量 , 需要 用 self.radius 
std::f64::consts::PI * Self.radius * self.radius 


























} 
} 


fn main() { 
let c = Circle { radius : 2f64}; 
// 编译 错误 
// c.areal(); 





let b = Box::new(Circle {radius : 4f64}); 
// 编译 正确 
b.areal(); 











impl 的 对 象 甚至 可 以 是 trait。 示 例如 下 : 





trait Shape { 
fn area(&self) -> f64; 


} 
trait Round { 


fn get_radius(&self) -> f64; 


Struct Circle { 
radius: f64, 
} 


impJ Round for Circle 
fn get_radius(&self) -> f64 { self.radius } 


























// 注意 这 里 是 impl Trait for Trait 
impJ Shape for Round { 
fn area(&self) -> f64 { 
std::f64::consts::PI * self.get radius() * self.get_radius() 
} 








} 


fn main() { 
let c = Circle { radius : 2f64}; 
// 编译 错误 
// c.areal(); 





let b = Box::new(Circle {radius : 4f64}) as Box<RouNnd>; 
// 编译 正确 
b .areal( ); 











注意 这 里 的 写法 ，impl Shape for Round 和 impl<T: Round>Shape for 
T 是 不 一 样 的 。 在 前 一 种 写法 中 ，self 是 &Round 类 型 ， 它 是 一 个 trait 
object， 是 胖 指 针 。 而 在 后 一 种 写法 中 ，self 是 &T 类 型 ， 是 具体 类 型 。 
前 一 种 写法 是 为 trait object 增 加 一 个 成 员 方 法 ， 而 后 一 种 写法 是 为 所 有 
的 满足 T: Round 的 具体 类 型 增加 一 个 成 员 方 法 。 所 以 上 面 的 示例 中 ， 
我 们 只 能 构造 一 个 trait object 之 后 才能 调用 area〈) 成 员 方 法 。trait 
object 和 "“ 泛 型 ”之 间 的 区 别 请 参考 本 书 第 三 部 分 。 


题 外 话 ，impl Shape for Round 这 种 写法 确实 是 很 让 初学 者 纠结 的 ， 
Round 既是 trait 又 是 type。 在 将 来 ，trait object 的 语法 会 被 要 求 加 上 dyn 关 
键 字 ， 所 以 在 Rust 2018 edition 以 后 应 该 写成 impl Shape for dyn Round 才 
合理 。 关 于 trait object 的 内 容 ， 请 参考 本 书 第 三 部 分 第 23 章 。 





5.2 ”静态 方法 


没有 receiver 参 数 的 方法 (第 一 个 参数 不 是 self 参 数 的 方法 ) 称 作 * 静 
态 方法 ”。 静 态 方 法 可 以 通过 Type: : FunctionName() 的 方式 调用 。 
需要 注意 的 是 ， 即 便 我 们 的 第 一 个 参数 是 Self 相 关 类 型 ， 只 要 变量 名 字 
不 是 self， 就 不 能 使 用 小 数 点 的 语法 调用 函数 。 





Struct T(i32); 


impl T { 
// 这 是 一 个 静态 方法 
fn func(this: &Self) 
println!i{"value {}", this.0}; 
} 





} 


fn main() { 
let x = T(42); 
// XxX.func(); 小 数 点 方式 调用 是 不 合法 的 
T: :func(&x); 





























} 








在 标准 库 中 就 有 一 些 这 样 的 例子 。Box 的 一 系列 方法 Box: : 

into raw (b: Self) Box: : leak (b: Self) ， 以 及 Rc 的 一 系列 方法 
Re: : try unwrap (this: Self) Rc: : downgrade (this: &Self) ， 都 是 
这 种 情况 。 它 们 的 receiver 不 是 self 关 键 字 ， 这 样 设计 的 目的 是 强制 用 户 
用 Rc: : downgrade 〈&obj) 的 形式 调用 ， 而 禁止 obj.downgrade() 形 
式 的 调用 。 这 样 源码 表达 出 来 的 意思 更 清晰 ， 不 会 因为 Rc<T> 里 面 的 成 
员 方 法 和 T 里 面 的 成 员 方法 重 名 而 造成 误解 问题 〈 这 又 涉及 Deref trait 的 
内 容 ， 读 者 可 以 把 第 16 章 读 完 再 回 看 这 一 段 ) 。 


trait 中 也 可 以 定义 静态 函数 。 下 面 以 标准 库 中 的 std: : default: : 
Default trait 为 例 ， 介 绍 静 态 函 数 的 相关 用 法 : 














pub trait Default { 
fn default() -> Self， 
} 





上 面 这 个 trait 中 包含 了 一 个 default() 函数 ， 它 是 一 个 无 参数 的 函 
数 ， 返 回 的 类 型 是 实现 该 trait 的 具体 类 型 。Rust 中 没有 “构造 函数 ”的 概 





念 。Default trait 实 际 上 可 以 看 作 一 个 针对 无 参数 构造 函数 的 统一 抽象 。 
比如 在 标准 库 中 ，Vec: : default() 就 是 一 个 普通 的 静态 函数 。 


























// 这 里 用 到 了 “ 泛 型 ”请 参阅 第 21 章 

impl<T> Default for Vec<T> { 

fn default() -> Vec<T> { 
Vec: :new() 














} 
} 





跟 C++ 相 比 ， 在 Rust 中 ， 定 义 静 态 函 数 没 必要 使 用 static 关 键 字 ， 因 
为 它 把 self 参 数 显 式 在 参数 列表 中 列 出 来 了 了。 作为 对 比 ，C++ 里 面 成 员 
方法 默认 可 以 访问 this 指 针 ， 因 此 它 需要 用 static 天 键 字 来 标记 静态 方 
法 。Rust 不 采取 这 个 设计 ， 主 要 原因 是 self 参 数 的 类 型 变化 太 多 ， 不 同 
写法 语义 差别 很 大 ， 选 择 显 式 声明 self 参 数 更 方便 指定 它 的 类 型 。 





5.3 扩展 方法 


我 们 还 可 以 利用 trait 给 其 他 的 类 型 添加 成 员 方 法 ， 哪 怕 这 个 类 型 不 
是 我 们 自己 写 的 。 比 如 ， 我 们 可 以 为 内 置 类 型 i32 添 加 一 个 方法 : 








trait Double { 
fn double(&self) -> Self; 


} 


imp Double for i32 { 
fn double(&self) -> i32 { *self * 2 } 
} 


fn main() { 
// 可 以 像 成 员 方 法 一 样 调用 
let x : i32 = 10.double(); 
println!i("{}", x); 























这 个 功能 就 像 C# 里 面 的 “扩展 方法 "一样 。 哪 介 这 个 类 型 不 是 在 当前 
的 项 目 中 声明 的 ， 我 们 依然 可 以 为 它 增 加 一 些 成 员 方 法 。 但 我 们 也 不 是 
随 随便 便 束 可 以 这 么 做 的 ，Rust 对 此 有 一 个 规定 。 


在 声明 trait 和 impl trait 的 时 候 ，Rust 规 定 了 一 个 Coherence Rule (一 
致 性 规则 ) 或 称 为 Orphan Rule 孤 儿 规 则 〉: impl 块 要 么 与 trait 的 声明 
在 同一 个 的 crate 中 ， 要 么 与 类 型 的 声明 在 同一 个 crate 中 。 


也 就 是 说 ， 如 果 trait 来 自 于 外 部 crate， 而 且 类 型 也 来 自 于 外 部 
crate， 编 译 器 不 允许 你 为 这 个 类 型 impl 这 个 trait。 它 们 之 中 必须 至 少 有 
一 个 是 在 当前 crate 中 定义 的 。 因 为 在 其 他 的 crate 中 ， 一 个 类 型 没有 实现 
一 个 trait， 很 可 能 是 有 意 的 设计 。 如 果 我 们 在 使 用 其 他 的 crate 的 时 候 ， 
强行 把 它们 “ 拉 即 配 ”， 是 会 制造 出 bug 的 。 比 如 说 ， 我 们 写 了 一 个 程 
序 ， 引 用 了 外 部 库 lib1 和 lib2，lib1 中 声明 了 一 个 traitT，1lib2 中 声明 了 一 
个 structS， 我 们 不 能 在 自己 的 程序 中 针对 $ 实 现 T。 这 也 意味 着 ， 上 游 开 
发 者 在 给 别人 写 库 的 时 候 ， 尤 其 要 注意 ， 一 些 比较 第 见 的 标准 库 中 的 
trait， 如 Display Debug ToString Default 等 ， 应 该 尽 可 能 地 提供 好 。 否 
则 ， 使 用 这 个 库 的 下 游 开 发 者 是 没 办 法 帮 我 们 把 这 些 trait 实 现 的 。 


同 理 ， 如 果 是 匿名 impl， 那 么 这 个 impl 块 必须 与 类 型 本 身 存在 于 同 
一 个 crate 中 。 








更 多 关于 “一 致 性 规则 ?的 解释 ， 可 以 参见 编译 器 的 详细 错误 说 明 : 





rustc --explain E0117 
rustc --explain E0210 








当 类 型 和 trait 涉 及 泛 型 参数 的 时 候 ， 一 致 性 规则 实际 上 是 很 复杂 
的 ， 用 户 如 果 需 要 了 解 所 有 的 细节 ， 还 需要 参考 对 应 的 RFC 文 档 。 


许多 初学 者 会 用 目 珊 GC 的 语言 中 的 “Interface”、 抽 象 基 类 来 理解 
trait 这 个 概念 ， 但 是 实际 上 它们 有 很 大 的 不 同 。 


Rust 是 一 种 用 户 可 以 对 内 存 有 精确 控制 能 力 的 强 类 型 语言 。 我 们 可 
以 自由 指定 一 个 变量 是 在 栈 里 面 ， 还 是 在 堆 里 面 ， 变 量 和 指针 也 是 不 同 
的 类 型 。 类 型 是 有 大 小 〈Size) 的 。 有 些 类 型 的 大 小 是 在 编译 阶段 可 以 
确定 的 ， 有 些 类 型 的 大 小 是 编译 阶段 无 法 确定 的 。 目 前 版 本 的 Rust 规 
定 ， 在 函数 参数 传递 、 返 回 值 传递 等 地 方 ， 都 要 求 这 个 类 型 在 编译 阶段 
有 确定 的 大 小 。 和 否则， 编译 器 就 不 知道 该 如 何 生成 代码 了 。 


而 trait 本 喘 既 不 是 具体 类 型 ， 也 不 是 指针 类 型 ， 它 只 是 定义 了 针对 
类 型 的 、 抽 象 的 “约束 ”。 不 同 的 类 型 可 以 实现 同一 个 trait， 满 足 同一 个 
trait 的 类 型 可 能 具有 不 同 的 大 小 。 因 此 ，trait 在 编译 阶段 没有 固定 大 
小 ， 目 前 我 们 不 能 直接 使 用 trait 作 为 实例 变量 、 人 参数、 返回 值 。 


有 一 些 初学 者 特别 喜欢 写 这 样 的 代码 : 























let x: Shape = Circle::new(); // Shape 不 能 做 局 部 变量 的 类 型 
fn use_shape(arg : Shape) 人 // Shape 不 能 直接 做 参数 的 类 型 
fn ret_shape() -> Shape 全 // Shape 不 能 直接 做 返回 值 的 类 型 











一 





















































这 样 的 写法 是 错误 的 。 请 一 定 要 记 住 ，trait 的 大 小 在 编译 阶段 是 不 
固定 的 。 那 怎样 写 才 是 对 的 呢 ? 后 面 我 们 讲 到 泛 型 的 时 候 再 说 。 





5.4 完整 钞 数 调用 语法 


Fully Qualified Syntax 提 供 一 种 无 上 疏 义 的 函数 调用 语法 ， 人 允许 程序 员 
精确 地 指定 想 调用 的 是 那个 函数 。 以 前 也 叫 UFCS (universal function 
call syntax) ， 也 就 是 所 谓 的 “通用 函数 调用 语法 ”。 这 个 语法 可 以 允许 使 
用 类 似 的 写法 精确 调用 任何 方法 ， 包 括 成 员 方 法 和 静态 方法 。 其 他 一 切 
函数 调用 语法 都 是 它 的 某 种 简略 形式 。 它 的 具体 写法 为 <T as 
TraitName>: : item。 示 例如 下 : 





trait Cook 
fn start(&self); 


trait Wash { 
fn start(&self); 


struct Chef; 


imp Cook for Chef { 
fn start(&self) { println!("Cook: :start"”) 
} 


impl Wash for Chef 
fn start(&self) { println!("Wash::start");} 


fn main() { 
let me = Chef; 
me.start(); 


} 





我 们 定义 了 两 个 trait， 它 们 的 start () 函数 有 同样 方法 签名 。 


如 果 一 个 类 型 同时 实现 了 这 两 个 trait， 那 么 如 果 我 们 使 用 
variable.start《 ) 这 样 的 语法 执行 方法 调用 的 话 ， 就 会 出 现 歧 义 ， 编 译 器 
不 知道 你 具体 想 调用 哪个 方法 ， 编 译 错误 信息 为 “multiple applicable 
items in scope”。 


这 时 候 ， 我 们 就 有 必要 使 用 完整 的 函数 调用 语法 来 进行 方法 调用 ， 
0 才能 清晰 明白 且 无 监 义 地 表达 清楚 期 望 调用 的 是 哪个 函 





fn main() { 
let me = Chef,; 

// 函数 名 字 使 用 更 完整 的 path 来 指定 , 同时 , self 参 数 需要 显 式 传递 
<Cook>: :start(&me); 
<Chef as Wash>::start(&me); 


} 


























由 此 我 们 也 可 以 看 到 ， 所 谓 的 “成 员 方 法 ”也 没什么 特殊 之 处 ， 它 跟 
普通 的 静态 方法 的 唯一 区 别 是 ， 第 一 个 参数 是 self， 而 这 个 self 只 是 一 个 
普通 的 函数 参数 而 已 。 只 不 过 这 种 成 员 方法 也 可 以 通过 变量 加 小 数 点 的 
方式 调用 。 变 量 加 小 数 点 的 调用 方式 在 大 部 分 情况 下 看 起 来 更 简单 更 美 
观 ， 完 全 可 以 视 为 一 种 语法 糖 。 


需要 注意 的 是 ， 通 过 小 数 点 语法 调用 方法 调用 ， 有 一 个 “隐藏 
着 ”的 “ 取 引 用 ” 步 又。 虽然 我 们 看 起 来 源 代 码 长 的 是 这 个 样子 
me.start 〈() ， 但 是 大 家 心里 要 清楚 ， 真 正 传递 给 start 〈) 方法 的 参数 是 
&me 而 不 是 me， 这 一 步 是 编译 器 上 自动 帮 有 我 们 做 的 。 不 论 这 个 方法 接受 
的 self 参 数 究竟 是 Self、&Self 还 是 &mut Self， 最 终 在 源码 上 ， 我 们 都 是 
统一 的 写法 : variable.method () 。 而 如 果 用 UFCS 语 法 来 调用 这 个 方 
法 ， 我 们 或 不 能 让 编译 器 帮 我 们 自动 取 引 用 了 ， 必 须 手 动 写 清楚 。 


下 和 面 用 一 个 示例 演示 一 下 成 员 方 法 和 普通 函数 其 实 没 什么 本 质 区 
别 。 














Struct T(usize); 


impl T { 
fn get1(&selLf) -> usize {self.0} 


fn get2(&self) -> usize {self.0} 


fn get3(t: &T) -> usize { t.0 } 
fn check_type( _ : fn(&T)->usize ) {} 


fn main() { 
Check_type(T: :get1) ， 
Check_type(T: :get2)， 
Check_type(get3) 

} 





可 以 看 到 ，getL、get2 和 get3 都 可 以 自动 转 成 mn (&T) -usize 类 
型 。 


5.5 trait 约 束 和 继承 


Rust 的 trait 的 另外 一 个 大 用 处 是 ， 作 为 泛 型 约束 使 用 。 关 于 泛 型 ， 
本 书 第 三 部 分 还 会 详细 解释 。 下 面 用 一 个 简单 示例 演示 一 下 trait 如 何 作 
为 泛 型 约束 使 用 : 








use std::fmt::Debug; 


fn my_print<T : Debug>(x: T) { 
println!("The value is {:?}.", x); 
} 


fn main() { 
my_print("China"); 
my_print(41 i32); 
my_print(true); 
my_print(['a'’, 'b', 'c']) 





上 面 这 段 代码 中 ，my_print 函 数 引入 了 一 个 泛 型 参数 T， 所 以 它 的 
参数 不 是 一 个 具体 类 型 ， 而 是 一 组 类 型 。 冒 号 后 面 加 trait 名 字 ， 就 是 这 
个 泛 型 参数 的 约束 条 件 。 它 要 求 这 个 T 类 型 实现 Debug 这 个 trait。 这 契 因 
为 我 们 在 函数 体内 ， 用 到 了 println! 格式 化 打印 ， 而 且 用 了 {: ? } 这 样 
的 格式 控制 符 ， 它 要 求 类 型 满足 Debug 的 约束 ， 奋 则 编译 不 过 。 

在 调用 的 时 候 ， 几 是 满足 Debug 约 束 的 类 型 都 可 以 是 这 个 函数 的 参 
数 ， 所 以 我 们 可 以 看 到 以 上 四 种 调用 都 是 可 以 编译 通过 的 。 假 如 我 们 自 
定义 一 个 类 型 ， 而 它 没 有 实现 Debug trait， 我 们 就 会 发 现 ， 用 这 个 类 型 
作为 my_print 的 参数 的 话 ， 编 译 就 会 报错 。 

所 以 ， 泛 型 约束 既是 对 实现 部 分 的 约束 ， 也 是 对 调用 部 分 的 约束 。 


泛 型 约束 还 有 另外 一 种 写法 ， 即 where 子 句 。 示 例如 下 : 











fn my_print<T>(x: T) where T: Debug { 
println!("The value is {:?}.", x); 











对 于 这 种 简单 的 情况 ， 两 种 写法 都 可 以 。 但 是 在 东 些 复杂 的 情况 


下 ， 泛 型 约束 只 有 where 子 句 可 以 表达 ， 号 的 写 
法 表达 不 出 来 ， 比 如 涉及 关联 类 型 的 时 候 ， 请 参见 第 21 章 。 


trait 人 允许 继 承 。 类 似 下 面 这 样 : 








trait Base { ... } 
trait Derived : Base { ... } 





这 表示 Derived trait 继 承 了 Base trait。 它 表达 的 意思 是 ， 满 足 Derived 
的 类 型 ， 必 然 也 满足 Base trait。 所 以 ， 我 们 在 针对 一 个 具体 类 型 impl 
Derived 的 时 候 ， 编 译 器 也 会 要 求 我 们 同时 impl Base。 示 例如 下 : 





trait Base {} 

trait Derived : Base 1 
struct T; 

impl Derived for T 人 


fn main() { 





编译 ? 出 现 错误 ， 提示 信息 为 : 





--> test.rs:7:6 


| 
7 | impl Derived for T {} 
| AAAAAAA the trait ‘Base. is not implemented for T° 





我 们 再 加 上 一 句 





impl Base for T {} 





编译 器 就 不 再 报错 了 。 


实际 上 ， 在 编译 器 的 眼中 ，trait Derived: Base{} 等 同 于 trait Derived 
where Self: Base{f}。 这 两 种 写法 没有 本 质 上 的 区 别 ， 都 是 给 Derived 这 
个 trait 加 了 一 个 约束 条 件 ， 即 实现 Derived trait 的 具体 类 型 ， 也 必须 满足 


Base trait 的 约束 。 


在 标准 库 中 ， 很 多 trait 之 间 都 有 继承 关系 ， 比 如 : 





trait Eq: PartialEq<Self> {} 

trait Copy: Clone {} 

trait Ord: Eq + Partialord<Self> {} 
trait FnMut<Args>: FnOnce<Args> 人 
trait Fn<Args>: FnMut<Args> {} 





读 完 本 书后 ， 读 者 应 该 能 够 理解 这 些 trait 是 用 来 做 什么 的 ， 以 及 为 
什么 这 些 trait 之 间 会 有 这 样 的 继承 关系 。 


5.6 Derive 


Rust 里 面 为 类 型 impl 某 些 trait 的 时 候 ， 人 逻辑 是 非常 机 械 化 的 。 为 许 
多 类 型 重复 而 单调 地 impl 某 些 trait， 是 非常 枯燥 的 事情 。 为 此 ，Rnust 提 
供 了 一 个 特殊 的 attribute， 它 可 以 帮 我 们 自动 impl 某 些 trait。 示 例如 下 : 





#[derive(Copy, Clone, Default, Debug, Hash, PartialEq, Eq, PartialoOrd, Ord)] 
struct Foo { 
data : i32 


fn main() { 
let vi = Foo { data : 0 }; 
let v2 = vi1; 
println!("{:?}", v2); 





如 上 所 示 ， 它 的 语法 是 ， 在 你 希望 impl trait 的 类 型 前 面 写 # 
[derive(...) ]， 括 号 里 面 是 你 希望 impl 的 trait 的 名 字 。 这 样 写 了 之 后 ， 
编译 器 就 帮 你 自动 加 上 了 impl 块 ， 类 似 这 样 : 








impl Copy for Foo { ... } 


impl Clone for Foo { ... } 
impl Default for Foo { ... } 
impl Debug for Foo { ... } 
impl Hash for Foo { ... } 

impl PartialEq for Foo { ... } 








这 些 trait 都 是 标准 库 内 部 的 较 特 殊 的 trait， 它 们 可 能 包含 有 成 员 方 
法 ， 但 是 成 员 方法 的 馆 辑 有 一 个 简单 而 一 致 的 “模板 可 以 使 用 ， 编 译 喜 
就 机 械 化 地 重复 这 个 模板 ， 帮 我 们 实现 这 个 默认 逻辑 。 当 然 我 们 也 可 以 
手动 实现 。 


目前 ，Rust 文 持 的 可 以 上 自动 derive 的 trait 有 以 下 这 些 : 








Debug Clone Copy Hash RustcEncodable RustcDecodable PartialEd Ed 
Parialord ord Default FromPrimitive Send Sync 





5.7 trait 别 名 


跟 type alias 类 似 的 ，trait 也 可 以 起 别名 (trait alias) 。 假 如 在 某 些 场 
景 下 ， 我 们 有 一 个 比较 复杂 的 trait: 





pub trait Service { 
type Redquest 
type Response,; 
type Error 
type Future: Future<Item=SeJf::Response，Error=Self::Error>， 
fn call(&self, req: Self: :Request) -> Self::Future,; 





每 次 使 用 这 个 trait 的 时 候 都 需要 携带 一 扒 的 关联 类型 参数 。 为 了 避 
0 在 已 经 确定 了 关联 类 型 的 场景 下 ， 我 们 可 以 为 它 取 一 个 
别 | ? 上 0]: 





trait HttpService = Service<Request = http::Request, 
Response = http::Response, 
Error = http::Error>,; 





5.8 ”标准 库 中 常见 的 trait 人 简介 


标准 库 中 有 很 多 很 有 用 的 trait， 本 市 挑 几 个 特别 常见 的 给 大 家 介绍 
一 个。 








5.8.1 Display 和 Debug 











这 两 个 trait 在 标准 库 中 的 定义 是 这 样 的 : 





// std::fmt::Display 
pub trait Display { 
fn fmt(&self, f: &mut Formatter) -> Result<(), Error>; 


} 
// std::fmt::Debug 
pub trait Debug { 
fn fmt(&self, f: &mut Formatter) -> Result<(), Error>; 
} 





它们 的 主要 用 处 就 是 用 在 类 似 println! 这 样 的 地 方 : 





use std::fmt::{Display, Formatter, Error},; 


#[derive(Debug)] 
Struct T { 
fieldi: i32, 
field2: i32, 
} 


impl Display for T { 
fn fmt(&self, f: &mut Formatter) -> Result<(), Error> { 
write!(f, "{{ fieldi:{}, field2:{} }}", self.fieldi, self.field2) 
} 


} 


fn main() { 
let var = T { fieldi: 1, field2: 2 }; 
println!i("{}", var); 
println!("{:?}", var); 
println!("{:#2?}", var); 





只 有 实现 了 Display trait 的 类 型 ， 才能 用 全 格式 控制 打印 出 来 ， 只 有 
实现 了 Debug trait 的 类 型 ， 才 能 用 {: ? }{: #? } 格 式 控 制 打印 出 来 。 它 


们 之 间 更 多 的 区 别 如 下 。 


:Display 假 定 了 这 个 类 型 可 以 用 utf-8 格 式 的 字符 串 表示 ， 它 是 准备 
给 最 终 用 户 看 的 ， 并 不 是 所 有 类 型 都 应 该 或 者 能 够 实现 这 个 trait。 这 个 
trait 的 fmt 应 该 如 何 格式 化 字符 串 ， 完 全 取决 于 程序 员 上 自己 ， 编 译 器 不 提 
供 自 动 derive 的 功能 。 


.标准 库 中 还 有 一 个 常用 trait 叫 作 std: : string: : ToString， 对 于 所 
有 实现 了 Display trait 的 类 型 ， 都 自动 实现 了 这 个 ToString trait。 它 包含 
了 一 个 方法 to_string 〈&self) ->String。 任 何 一 个 实现 了 Display trait 的 类 
型 ， 我 们 都 可 以 对 它 调用 to_string 〈) 方法 格式 化 出 一 个 字符 串 。 


.Debug 则 是 主要 为 了 调试 使 用 ， 建 议 所 有 的 作为 API 的 “公开 ”类 型 
都 应 该 实现 这 个 trait， 以 方便 调试 。 它 打印 出 来 的 字符 串 不 是 以 “美观 易 
读 ” 为 标准 ， 编 译 占 提供 了 目 动 derive 的 功能 。 








5.8.2 PartialOrd/Ord/PartialEq/Eq 


在 前 文中 讲解 浮 点 类 型 的 时 候 提 到 ， 因 为 NaN 的 存在 ， 浮 点 数 是 不 
具备 “total order (全 序 关 系 ) ”的 。 在 这 里 ， 我 们 详细 讨论 一 下 什么 是 全 
序 、 什 么 是 偏 序 。Rust 标 准 库 中 有 如 下 解释 。 

对 于 集合 X 中 的 元 素 a，b，e， 


.如 果 a<b 则 一 定 有 ! (a>b); 反之 ， 若 a>b， 则 一 定 有 ! 
(a<b) ， 称 为 反对 称 性 。 


.如 果 a<b 且 b<c 则 a<c， 称 为 传递 性 。 


.对 于 X 中 的 所 有 元 素 ， 都 存在 a<b 或 a>b 或 者 a==b， 三 者 必 居 其 一 ， 
称 为 完全 性 。 

如 果 和 集合 X 中 的 元 素 只 具备 上 述 前 两 条 特征 ， 则 称 X 是 “ 偏 序 ”"。 同 
时 具备 以 上 所 有 特征 ， 则 称 X 是 “全 序 ”。 


从 以 上 定义 可 以 看 出 ， 浮 点 数 不 上 共 备 “全 订 ” 特 征 ， 因 为 浮 扣 数 中 特 
殊 的 值 NaN 不 满足 完全 性 。 这 就 导致 了 一 个 问题 : 浮 扣 数 无 法 排 厅 。 对 











NN 无 法 分 出 先后 关系 。 示 例 
0 下 ; 





fn main() { 
let nan = std::f32::NAN; 
let x = 1.0f32; 
println!i("{}", nan < x); 
println!i("{}", nan > x); 
println!i("{}", nan == x); 





以 上 不 论 是 NaN<x，NaN>x 还 是 NaN==x， 结 果 都 是 false。 这 是 
IEEE754 标 准 中 规定 的 行为 。 


因此 ，Rust 设 计 了 两 个 trait 来 描述 这 样 的 状态 : 一 个 是 std: 
cmp: : PartialOrd， 表 示 “ 偏 序 ”， 一 个 是 std: : cmp: : Ord， 表 示 ? 全 
序 "3 它们 的 对 外 接口 是 这 样 定义 的 : 








pub trait Partialord<Rhs: ?Sized = Self>: PartialEq<Rhs> { 
fn partial cmp(&self, other: &Rhs) -> Option<Ordering>; 


fn lt(&self, other: &Rhs) -> bool { //. } 
fn le(&self, other: &Rhs) -> bool { //. } 
fn gt(&self, other: &Rhs) -> bool { //. } 
fn ge(&self, other: &Rhs) -> bool { //... } 


pub trait Ord: Eq + PartialOrd<Self> { 
fn cmp(&self, other: &Self) -> Ordering; 





从 以 上 代码 可 以 看 出 ，partial_cmp 了 水 数 的 返回 值 类 型 是 
Option<Ordering>。 只 有 Ord trait 里 面 的 cmp 函 数 才能 返回 一 个 确定 的 
Ordering。f32 和 f64 类 型 都 只 实现 了 PartialOrd， 而 没有 实现 Oi 


因此 ， 如 果 我 们 写 出 下 面 的 代码 ， 编 译 占 是 会 报错 的 : 





let int_vec = [1 i32, 2, 3]; 
Jet biggest_int = int_vec,.iter().max(); 


Jet float_ vec = [1.0_ f32, 2.0, 3.0]; 
Jet biggest_ float = float vec.iter().max(); 





对 整数 i32 类 型 的 数组 求 最 大 值 是 没 问 题 的 ， 但 是 对 浮 点 数 类 型 的 
数组 求 最 大 值 是 不 对 的 ， 编 译 错误 为 : 





the trait 'core::cmp::Ord' is not implemented for the type ‘'f32' 





笔者 认为 ， 这 个 设计 是 优点 ， 而 不 是 缺点 ， 它 让 我 们 尽 可 能 地 在 更 
早 的 阶段 发 现 错误 ， 而 不 是 留 到 运行 时 再 去 debug。 假 如 说 编译 器 无 法 
静态 检查 出 这 样 的 问题 ， 那 么 吏 可 能 发 生 下 面 的 情况 ， 以 Python 为 例 : 








Python 3.4.2 (default，Oct 8 2014, 10:45:20) 

[GCC 4.9.1] on linux 

Type "help", "copyright", "credits" or "license" for more information. 
>>> v = [1.0, float("nan")] 

>>> max(v) 

1.0 

>>> v = [float("nan"), 1.0] 

>>> max(v) 

nan 





上 面 这 个 示例 意味 着 ， 如 果 数 组 v 中 有 NaN， 对 它 求 最 大 值 ， 跟 数 
组 内 部 元 素 的 排列 顺序 有 关 。 


Rust 中 的 PartialOrd trait 实 际 上 就 是 C++20 中 即将 加 入 的 three-way 
comparison 运 算 符 <=>。 


同 理 ，PartialEq 和 Eq 两 个 trait 也 就 可 以 理解 了 ， 它 们 的 作用 是 比较 
相等 关系， 与 排序 关系 非常 类 似 。 





5.8.3 Sized 


Sized trait 是 Rust 中 一 个 非常 重要 的 trait， 它 的 定义 如 下 : 





#[lang = "sized"] 
#[rustc_on_unimplemented = " {Self} does not have a constant size known at compile- 
#[fundamental] // for Default, for example, which requires that ‘[T]: !Default be 4 
pub trait Sized { 

// Empty. 
} 








这 个 trait 定 义 在 std: : marker 模 块 中 ， 它 没有 任何 的 成 员 方法 。 它 
有 #[lang="sized"] 属 性 ， 说 明 它 与 普通 trait 不 同 ， 编 译 器 对 它 有 特殊 的 处 
理 。 用 户 也 不 能 针对 自己 的 类 型 impl 这 个 trait。 一 个 类 型 是 否 满 足 Sized 


约束 是 完全 由 编译 器 推导 的 ， 用 户 无 权 指定 。 


我 们 知道 ， 在 C/C++ 这 一 类 的 语言 中 ， 大 部 分 变量 、 参 数 、 返 回 值 
都 应 该 是 编译 阶段 固定 大 小 的 。 在 Rust 中 ， 但 凡 编 译 阶段 能 确定 大 小 的 
类 型 ， 都 满足 Sized 约 束 。 那 还 有 什么 类 型 是 不 满足 Sized 约 束 的 呢 ? 比 
如 C 语 言 里 的 不 定 长 数组 (Variable-length Array) 。 不 定 长 数组 的 长 度 
在 编译 阶段 是 未 知 的 ， 是 在 执行 阶段 才 确 定 下 来 的 。Rust 里 面 也 有 类 似 
的 类 型 [T]。 在 Rust 中 VLA 类 型 已 经 通过 了 RFC 设 计 ， 只 是 暂时 还 没有 实 
现 而 已 。 不 定 长 类 型 在 使 用 的 时 候 有 一 些 限制 ， 比 如 不 能 用 它 作 为 函数 
的 返回 类 型 ， 而 必须 将 这 个 类 型 藏 到 指针 背后 才 可 以 。 但 它 作为 一 个 类 
意义 的 ， 我 们 可 以 为 它 添 加 成 员 方 法 ， 用 它 实 例 化 泛 型 参 

， 三 于 于 o 


Rust 中 对 于 动态 大 小 类 型 专门 有 一 个 名 词 Dynamic Sized Type。 我 
们 后 面 将 会 看 到 的 [T]，str 以 及 dyn Trait 都 是 DST。 








5.8.4 Default 


Rust 里 而 并 没有 C++ 里 面 的 “构造 浮 数 ”的 概念 。 大 家 可 以 看 到 ， 它 
只 提供 了 类 似 C 语 言 的 各 种 复合 类 型 各 自 的 初始 化 语法 。 主 要 原因 在 
于 ， 相 比 普 通 函 数 ， 构 造 函 数 本 喘 并 没有 提供 什么 额外 的 抽象 能 力 。 所 
以 Rust 里 面 推荐 使 用 普通 的 静态 函数 作为 类 型 的 “构造 器 ”*。 比 如 ， 常 见 
的 标准 库 中 提供 的 字符 串 类 型 String， 它 包含 的 可 以 构造 新 的 String 的 方 
法 不 完全 列举 都 有 这 人 么 多 : 











fn new() -> String 

fn with_capacity(capacity: usize) -> String 

fn from_utf8(vec: Vec<u8>) -> Result<String, FromUtf8Error> 

fn from_ utf8_lossy<'a>(v: &'a [u8]) -> Cow<'a, str> 

fn from utf1i6(v: &[u16]) -> Result<String, FromUtf1i6Error> 

fn from_ utf16 lossy(v: &[u16]) -> String 

unsafe fn from _ raw parts(buf: *mut u8, length: usize, capacity: usize) -> String 
unsafe fn from utf8_unchecked(bytes: Vec<u8>) -> String 





这 还 不 算 Default: : default () 、From: : from (s: &’a str) 、 
Fromlte-r-a-t-or: : from iter<I: Intolterator<Item=char>> (iter: 1) 、 
Iter-a-t-or: : collect 等 相对 复杂 的 构造 方法 。 这 些 方法 接受 的 参数 各 
异 ， 错 误 处 理 方式 也 各 异 ， 强 行将 它们 统一 到 同名 字 的 构造 函数 重 载 中 
不 是 什么 好 主意 (况且 Rust 坚 决 反对 ad hoc 式 的 函数 重 载 ) 。 





不 过 ， 对 于 那 种 无 参数 、 无 错误 处 理 的 简单 情况 ， 标 准 库 中 提供 了 
Default trait 来 做 这 个 统一 抽象 。 这 个 trait 的 签名 如 下 : 





trait Default 
fn default() -> Self， 
} 





它 只 包含 一 个 “静态 函数 ”default() 返回 Self 类 型 。 标 准 库 中 很 多 
类 型 都 实现 了 这 个 trait， 它 相当 于 提供 了 一 个 类 型 的 默认 值 。 


在 Rust 中 ， 单 词 new 并 不 是 一 个 关键 字 。 所 以 我 们 可 以 看 到 ， 很 多 
类 型 中 都 使 用 了 new 作 为 函数 名 ， 用 于 命名 那 种 最 常用 的 创建 新 对 象 的 
情况 。 因 为 这 些 new 函 数 差 别 甚 大 ， 所 以 并 没有 一 个 trait 来 对 这 些 new 函 
数 做 一 个 统一 抽象 。 





5.9 总 结 

本 章 对 trait 这 个 概念 做 了 基本 的 介绍 。 除 了 上 面 介绍 的 之 外 ，trait 
还 有 许多 用 处 : 

:trait 本 身 可 以 携 融 泛 型 参数 ; 

trait 可 以 用 在 泛 型 参数 的 约束 中 ; 

trait 可 以 为 一 组 类 型 impl， 也 可 以 单独 为 某 一 个 具体 类 型 impl， 而 
且 它 们 可 以 同时 存在 ; 

:trait 可 以 为 某 个 trait impl， 而 不 是 为 菜 个 具体 类 型 impl; 

Ql 而 且 还 可 以 包含 类 型 构造 实现 高 阶 类 
型 的 某 些 功能 

:trait 可 以 实现 泛 型 代码 的 静态 分 派 ， 也 可 以 通过 trait object 实 现 动 
态 分 派 ; 

trait 可 以 不 包含 任何 方法 ， 用 于 给 类 型 做 标签 (marker) ， 以 此 来 
描述 类 型 的 一 些 重要 特性 ; 

trait 可 以 包含 常量 。 


trait 这 个 概念 在 Rust 语 言 中 扮演 了 非常 重要 的 角色 ， 承 担 了 各 种 各 
样 的 功能 ， 在 写 代 但 的 时 候 会 经 划 用 到 。 本 章 还 远 没 有 把 trait 相 关 的 知 
识 讲解 完整 ， 更 多 关于 trait 的 内 容 ， 请 参 疯 本 书后 文中 与 泛 型 、trait 
object 线 程 安 全 有 关 的 章节 








第 6 章 ”数组 和 字符 串 
6.1 数组 


数组 是 一 个 容器 ， 它 在 一 块 连续 空间 内 存 中 ， 存 储 了 一 系列 的 同样 
类 型 的 数据 。 数 组 中 元 素 的 占用 空间 大 小 必须 是 编译 期 确定 的 。 数 组 本 
身 所 容纳 的 元 素 个 数 也 必须 是 编译 期 确定 的 ， 执 行 阶段 不 可 变 。 如 果 需 
要 使 用 变 长 的 容器 ， 可 以 使 用 标准 库 中 的 Vec/LinkedList 等 。 数 组 类 型 
的 表示 方式 为 [T; n]。 其 中 TIT 代表 元 素 类 型 ，n 代 表 元 素 个 数 ， 它 必须 是 
编译 期 常量 整数 ， 中 间 用 分 号 隔 开 。 下 面 看 一 个 基本 的 示例 : 





fn main() { 
// 定 长 数组 
let xs: [i32; 5] = [1, 2, 3, 4, 5]; 








// 所 有 的 元 素 , 如 果 初 始 化 为 同样 的 数据 , 可 以 使 用 如 下 语法 
let ys: [i32; 500] = [0; 500]; 





在 Rust 中 ， 对 于 两 个 数组 类 型 ， 只 有 元 素 类 型 和 元 素 个 数 都 完全 相 
同 ， 这 两 个 数组 才 是 同类 型 的 。 数 组 与 指针 之 间 不 能 隐 式 转换 。 同 类 型 
的 数组 之 间 可 以 互相 赋值 。 示 例如 下 : 





fn main() { 


let mut xs: [i32; 5] = [1，2，3， 
let ys: [i32; 5] = [6, 7, 8, 


了 
println!("new array {:?}", xs); 





把 数组 xs 作为 参数 传 给 一 个 函数 ， 这 个 数组 并 不 会 退化 成 一 个 指 
针 。 而 是 会 将 这 个 数组 完整 复制 进 这 个 函数 。 函 数 体 内 对 数组 的 改动 不 
会 影响 到 外 面 的 数组 。 


对 数组 内 部 元 又 的 访问 ， 可 以 使 用 中 括号 索引 的 方式 。Rust 文 持 
usize 类 型 的 索引 的 数组 ， 索 引 从 0 开始 计数 。 





fn main() { 
let v : [i32; 5] = [1,2,3,4,5]; 
let x = v[9] + v[1]; // 把 第 一 个 元 素 和 第 二 个 元 素 的 值 相 加 
println!i("sum is {}", x); 














6.1.1 内 置 方法 


与 其 他 所 有 类 型 一 样 ，Rust 的 数组 类 型 拥有 一 些 内 置 方法 ， 可 以 很 
方便 地 完成 一 些 任务 。 比 如 ， 我 们 可 以 直接 实现 数组 的 比较 操作 ， 只 要 
它 包 含 的 元 素 是 可 以 比较 的 : 





fn main() { 
let vi = [1, 2, 3]; 
let v2 = [1, 2, 4]; 
println!("{:?2}", vi < v2 ); 
} 





我 们 也 可 以 对 数组 执行 过 历 操 作 ， 如 : 





fn main() { 
let v = [0 i32; 10]; 


for i in &v 
println!("{:?}", i); 
} 


} 





在 目前 的 标准 库 中 ， 数 组 本 身 没 有 实现 IntoIterator trait， 但 是 数组 
切片 是 实现 了 的 。 所 以 我 们 可 以 直接 在 for in 循环 中 使 用 数组 切片 ， 而 不 
能 直接 使 用 数组 本 号。 更 详细 的 内 容 请 参阅 后 文中 关于 迭代 天 的 解释 。 


6.1.2 ”多维 数组 


既然 [T; n] 古 一 个 合法 的 类 型 ， 那 么 它 的 元 素 T 当 然 也 可 以 是 数组 
类 型 ， 因 此 [[T; m]; n] 类 型 自然 也 是 合法 类 型 。 示 例如 下 : 





fn main() 
let v : [[i32; 2]; 3] = [[9, 0], [9, 0], [9, 0]]; 


for i In &v { 
println!("{:?}", i); 





6.1.3 ”数组 切片 


对 数组 取 借 用 borrow 操 作 ， 可 以 生成 一 个 “数组 切片 ”(Slice》。 数 
组 切片 对 数组 没有 “所 有 权 ”， 我 们 可 以 把 数组 切片 看 作 专 门 用 于 指向 数 
组 的 指针 ， 是 对 数组 的 另外 一 个 “视图 "。 比 如 ， 我 们 有 一 个 数组 [T; 
n]， 它 的 借用 指针 的 类 型 就 是 &[T; nm。 它 可 以 通过 编译 器 内 部 魔法 转 
换 为 数组 切片 类 型 &[T]。 数 组 切片 实质 上 还 是 指针 ， 它 不 过 是 在 类 型 系 
统 中 丢 痉 了 编译 阶段 定 长 数组 类 型 的 长 度 信息 ， 而 将 此 长 度 信息 存储 为 
运行 期 的 值 。 示 例如 下 : 











fn main() { 
fn mut_array(a : &mut [i32]) { 


a[2] = 5; 
} 
println!("size of &[i32; 3] : {:?}", Std::mem::size of::<&[i32; 3]>()); 
println!("size of &[i32] : {:?}", std::mem::size of::<&[i32]>()); 


let mut v : [i32; 3] = [1,2,3]; 

{ 
let s : &mut [i32; 3] = &mut v; 
mut_array(s); 


} 
println!i("{:?}", Vv); 





变量 v 是 [i32; 3] 类 型 ， 变 量 s 是 &mnut[i32; 3] 类 型 ， 占 用 的 空间 大 小 
与 指针 相同 。 它 可 以 自动 转换 为 &mnut[i32] 数 组 切片 类 型 传 入 函数 
mut_array， 占 用 的 空间 大 小 等 于 两 个 指针 的 空间 大 小 。 通 过 这 个 指针 ， 
在 函数 内 部 ， 修 改 了 外 部 的 数组 v 的 值 。 





6.1.4 DST 和 胖 指 针 


从 前 面 的 示例 中 可 以 看 到 ， 数 组 切片 是 指向 一 个 数组 的 指针 ， 而 它 
比 指针 又 多 了 一 点 东西 一 一 它 不 止 包含 有 一 个 指 疝 数组 的 指针 ， 切 片 本 


身 还 含 带 长 度 信 息 。 





Slice 与 普通 的 指针 是 不 同 的 ， 它 有 一 个 非常 形象 的 名 字 : 胖 指 针 
(fat pointer) 。 与 这 个 概念 相对 应 的 概念 是 “动态 大 小 类 型 ”(Dynamic 
Sized Type，DST) 。 所 谓 的 DST 指 的 是 编译 阶段 无 法 确定 占用 空间 大 
小 的 类 型 。 为 了 安全 性 ， 指 问 DST 的 指针 一 般 是 胖 指 针 。 


比如 : 对 于 不 定 长 数组 类 型 [T]， 有 对 应 的 胖 指 针 &[T] 类 型 ， 对 于 
不 定 长 字符 串 str 类 型 ， 有 对 应 的 胖 指 针 &str 类 型 ， 以 及 在 后 文中 会 出 现 


的 Trait Object; 等 等 。 


由 于 不 定 长 数组 类 型 [T] 在 编译 阶段 是 无 法 判断 该 类 型 占用 空间 的 
大 小 的 ， 目 前 我 们 不 能 在 栈 上 声明 一 个 不 定 长 大 小 数组 的 变量 实例 ， 也 
不 能 用 它 作 为 函数 的 参数 、 返 回 值 。 但 是 ， 指 向 不 定 长 数组 的 胖 指 针 的 
大 小 是 确定 的 ，&[T] 类 型 可 以 用 做 变量 实例 、 函 数 参 数 、 返 回 值 。 


通过 前 面 的 示例 我 们 可 以 看 到 ，&[T] 类 型 占用 了 两 个 指针 大 小 的 内 
Ee 间 。 我 们 可 以 利用 unsafe 代 码 把 这 个 胖 指 针 内 部 的 数据 打印 出 来 看 





fn raw_slice(arr: &[i32]) { 
unsafe { 
let (vali, val2) : (usize, usize) = std::mem::transmute(arr); 
println!("Value in raw pointer:"); 
println!("VvValue1: {:x}", val1); 
println!("value2: {:x}", val2); 


} 

fn main() { 
let arr : [i32; 5] = [1i, 2, 3, 4, 5]; 
let address : &[i32; 5] = &arr; 
println!("Address of arr: {:p}", address); 


raw_slice(address as &[i32]); 





在 这 个 示例 中 ， 我 们 arr 是 长 度 为 5 的 i132 类 型 的 数组 。address 是 一 个 
普通 的 指向 arr 的 借用 指针 。 我 们 可 以 用 as 关 键 字 把 address 转 换 为 一 个 胖 
站 针 &[i32]， 并 传递 给 raw_slice 函 数 。 在 raw_slice 函 数 内 部 ， 我 们 利用 
了 unsafe 的 transmute 函 数 。 我 们 可 以 把 它 看 作 一 个 强制 类 型 转换 ， 类 似 
reinterpret_cast， 通 过 这 个 函数 ， 我 们 把 胖 指针 的 内 部 数据 转换 成 了 两 
个 usize 大 小 的 整数 来 看 待 。 编 译 ， 执 行 ， 结 果 为 : 





$ ./test 

Address of arr: Oxe2e236f6cc 
Value in raw pointer: 
value1: e2e236f6cc 

value2: 5 





由 此 可 见 ， 胖 指针 内 部 的 数据 既 包 含 了 指 问 源 数组 的 地 址 ， 又 包含 
了 该 切片 的 长 度 。 

对 于 DST 类 型 ，Rust 有 如 下 限制 |: 

:只 能 通过 指针 来 间接 创建 和 操作 DST 类 型 ，&[T]Box<[T]> 可 以 ， 
[TIT] 不 可 以 ; 

:局 部 变量 和 函数 参数 的 类 型 不 能 是 DST 类 型 ， 因 为 局 部 变量 和 函 
数 参 数 必须 在 编译 阶段 知道 它 的 大 小 因为 目前 unsized rvalue 功 能 还 没有 
实现 ; 

.enum 中 不 能 包含 DST 类 型 ，struct 中 只 有 最 后 一 个 元 素 可 以 是 
DST， 其 他 地 方 不 行 ， 如 果 包 含有 DST 类 型 ， 那 么 这 个 结构 体 也 就 成 了 
DST 类 型 。 


Rust 设 计 出 DST 类 型 ， 使 得 类 型 暂时 系统 更 完善 ， 也 有 助 于 消除 一 
些 C/C++ 中 容易 出 现 的 pug。 这 一 设计 的 好 处 有 : 

首先 ，DST 关 型 虽然 有 一 些 限 制 条 件 ， 但 我 们 依然 可 以 把 它 当 成 
合法 的 类 型 看 待 ， 比 如 ， 可 以 为 这 样 的 类 型 实现 trait、 添 加 方法 、 用 在 
泛 型 参数 中 等 ; 


翌 指 针 的 设计 ， 避 免 了 数组 类 型 作为 参数 传递 时 目 动 退化 为 裸 指 
针 类 型 ， 丢 失 了 长 度 信息 的 问题 ， 保 证 了 类 型 安全 


-这 一 设计 依然 保持 了 与 "所有权 关 生命 周期 ”等 概念 相 容 的 特点 。 


数组 切片 不 只 是 提供 了 “数组 到 指针 ”的 安全 转换 ， 配 合 上 Range 功 
能 ， 它 还 能 提供 数组 的 局 部 切片 功能 。 

















6.1.5 Range 


Rust 中 的 Range 代 表 一 个 “区 间 ”， 一 个 “范围 >， 它 有 内 置 的 语法 文 
持 ， 就 是 两 个 小 数 点 ..。 示 例如 下 : 





fn main() { 
let r = 1..10;  // r 是 一 个 Range<i32>, 中间 是 两 个 点 ,代表 [1, 19) 这 个 区 间 
for i in r { 
print!("{:?}\t", i); 








$ ./test 
1 2 3 4 5 6 7 8 9 





需要 注意 的 是 ， 在 begin..end 这 个 语法 中 ， 前 面 是 朵 区 间 ， 后 面 是 开 
区 间 。 这 个 语法 实际 上 生成 的 是 一 Nstd: : ops: : Range<_> 类 型 的 变 
量 。 访 类 型 在 标准 库 中 的 定义 如 下 : 








pub struct Range<Idx> { 
/// The lower bound of the range (inclusive). 
pub start: Idx, 
/// The upper bound of the range (exclusive). 
pub end: Idx, 





所 以 ， 上 面 那 段 示例 代码 实质 上 等 同 于 下 面 这 段 代 码 : 





use std::ops::Range; 


fn main() { 
let r = Range {start: 1, end: 10}; // rr 是 一 个 Range<i32> 
for i inr 
print!("{:?2}\t", i); 
} 


} 








两 个 小 数 点 的 语法 仪 仪 是 一 个 “语法 糖 * 而 已 ， 用 它 构 造 出 来 的 变量 


是 Range 类 型 。 


这 个 类 型 本 身 实 现 了 Iterator trait， 因 此 它 可 以 直接 应 用 到 循环 语句 





中 。Range 具 有 迭代 器 的 全 部 功能 ， 因 此 它 能 调用 迭代 器 的 成 员 方 法 。 
比如 ， 我 们 要 实现 从 100 递 减 到 10， 中 间 间 隔 为 10 的 序列 ， 可 以 这 么 做 
(有 具体 语法 请 参考 后 文中 的 迭代 器 、 闭 包 等 章节 ) : 





fn main() { 
use std::iter::Iterator; 

// 先 用 rev 方 法 把 这 个 区 间 反 过 来 ,然后 用 map 方 法 把 每 个 元 素 乘 以 10 
let r = (1i32..11).rev().map(|i| i * 10); 









































for i inr { 
print!("{:?}\t", i); 








} 
执行 结果 为 : 
$ ./test 
100 90 80 70 60 50 40 30 20 10 





在 Rust 中 ， 还 有 其 他 的 几 种 Range， 包 括 
'std: : ops: : RangeFrom 代 表 只 有 起 始 没有 结束 的 犯 围 ， 语 法 为 


start..， 含 义 是 [start，+oo) ; 

std: : ops: : RangeTo 代 表 没 有 起 始 只 有 结束 的 范围 ， 语 法 
为 .end， 对 有 符号 数 的 含义 是 〈-oo，end) ， 对 无 符号 数 的 含义 是 [0， 
end) ; 


‘std: : Ops: : RangeFull 代 表 没 有 上 下 限制 的 范围 ， 语法 为 ..， 对 
有 符号 数 的 含义 是 〈-o%，+oo) ， 对 无 符号 数 的 含义 是 [0，+%) 。 


数组 和 Range 之 间 最 常用 的 配合 就 是 使 用 Range 进 行 索引 操作 。 示 例 
0 下 ; 








fn print_slice(arr: &[i32]) { 
println!("Length: {}", arr.1len()); 


for item in arr { 
print!("{}\t", item); 


} 
println!(""); 
} 


fn main() { 
let arr : [i32; 5] = [1i, 2, 3, 4, 5]; 
print_slice(&arr[..|]); // full range 


let slice = &arr[2..]; // RangeFrom 
print_slice(slice); 


let slice2 = &slice[..2]; // RangeTo 
print_slice(slice2); 








Length: 5 

1 2 3 4 5 
Length: 3 

3 4 5 

Length: 2 

3 4 





第 一 次 打印 ， 内 容 为 整个 arr 的 所 有 区 间 。 第 二 次 打印 ， 是 从 arr 的 
index 为 2 的 元 素 开 始 算 起 ， 一 直到 最 后 。 注 意 数组 是 从 index 为 0 开始 计 
算 的 。 第 三 次 打印 ， 是 从 slice 的 头 部 开始 ， 长 度 为 2， 因 此 只 打印 出 了 
3、4 两 个 数字 。 


在 许多 时 候 ， 使 用 数组 的 一 部 分 切片 作 为 被 操作 对 象 在 函数 间 传 
递 ， 既 保证 了 效率 《避免 百 接 复制 大 数组 ) ， 又 能 保证 将 所 需要 执行 的 
操作 限制 在 一 个 可 控制 的 范围 内 (有 长 度 信 息 ， 有 越界 检查 ) ， 还 能 控 
制 其 读 写 权限 ， 非 第 有 用 。 


虽然 左 闭 右 开 区 间 是 最 常用 的 写法 ， 然 而 ， 在 有 些 情况 下 ， 这 种 语 
法 不 足以 处 理 边界 问题 。 比 如 ， 我 们 希望 产生 一 个 i32 类 型 的 从 0 到 
i32: : MAX 的 范围 ， 就 无 法 表示 。 因 为 授 语 法 ， 我 们 应 该 写 0.. 
(i32: : MAX+1) ， 然 而 (i32: : MAX+1) 已 经 溢出 了 。 所 以 ，Rust 
还 提供 了 一 种 左 闭 右 闭 区 间 的 语法 ， 它 使 用 这 种 语法 来 表示 ..=。 


闭 区 间 对 应 的 标准 库 中 的 类 型 是 : 














:std: : ops: : RangeInclusive， 语 法 为 start..=end， 含 义 是 [start， 
end]。 


std: : ops: : RangeTolInclusive， 语 法 为 ..=end， 对 有 符号 数 的 含 


义 是 〈-oo，end]， 对 无 符号 数 的 含义 是 [0，end] 


6.1.6 边界 检查 





在 前 面 的 示例 中 ， 我 们 的 “索引 ”都 是 一 个 合法 的 值 ， 没 有 超过 数组 
的 长 度 。 如 末 我 们 给 “索引 ”一 个 非法 的 值 会 怎样 呢 : 





fn main() { 
let v = [10i32, 20, 30, 40, 50]; 
Jet index : usize =std :: env :: args(). nth(1). map(|x|x.parse().unwrap_or(0)). 
println!("{:?}", v[index]); 





编译 通过 ， 执 行 thread'main'panicked atindex out of bounds: the len is 
5 but the index is 10'"。 可 以 看 出 ， 如 果 用 /test 10， 则 会 出 现 数组 越界 ， 
Rust 目 前 还 无 法 任意 索引 执行 编译 阶段 边界 检查 ， 但 是 在 运行 阶段 执行 
了 边界 检查 。 下 面 我 们 分 析 一 下 边界 检查 背后 的 故事 。 


在 Rust 中 , “索引 ”操作 也 是 一 个 通用 的 运算 符 ， 是 可 以 自行 扩展 
的 。 如 果 希 望 茶 个 类 型 可 以 执行 “索引 ” 读 操作 ， 就 需要 该 类 型 实现 
std: : ops: : Index trait, 如 果 希 望 某 个 类 型 可 以 执行 “索引 ” 写 操作 ， 
束 需 要 该 类 型 实现 std: : ops: : IndexMut trait。 


对 于 数组 类 型 ， 如 果 使 用 usize 作 为 索引 类 型 执行 读 取 操 作 ， 实 际 执 
行 的 是 标准 库 中 的 以 下 代码 : 

















impl<T> ops::Index<usize> for [T] { 
type Output = TT; 


fn index(&self, index: usize) -> &T { 
assert!(index < self.1len()); 
unsafe { self.get_ unchecked(index) } 
} 
} 





代码 中 使 用 的 assert! 宏 定义 在 libcore/macros.rs 中 ， 源 人 码 是 这 样 的 : 





macro_rules! assert { 
($cond:expr) => ( 
If !$cond { 


panic!(concat!("assertion failed: ", stringify!($cond))) 


); 
($cond:expr, $($arg:tt)+) => ( 
if !$cond { 
panic!($($arg)+) 





也 束 是 说 ， 如 果 index 超 过 了 数组 的 真实 长 度 范 围 ， 会 执行 panic! 
| ， 导 致 线程 abort。 使 用 Range 等 类 型 做 Index 操作 的 执行 流程 与 此 类 
以 。 


为 了 防止 索引 操作 导致 程序 崩 尝 ， 如 果 我 们 不 确定 使 用 的 “索引 ”是 
侍 合 法 ， 应 该 使 用 get() 方法 调用 来 获取 数组 中 的 元 素 ， 这 个 方法 不 
会 引起 panic! ， 它 的 返回 类 型 是 Option<T>， 示 例如 下 : 





fn main() { 
let v = [10i32, 20, 30, 40, 50]; 
let first = v.get(0); 
let tenth = v.get(10); 
println!("{:?} {:?2}", first, tenth); 
} 





输出 结果 为 : “Some (10) None”。 


Rust 宣 称 的 优点 是 “无 GC 的 内 存 安 全 ”， 那 么 数组 越界 会 直接 导致 程 
序 骨 尝 这 件 事 情 是 否 意味 着 Rust 不 够 安全 呢 ? 不 能 这 么 理解 。Rust 保 证 
的 “内 存 安全 ”， 并 非 意味 着 “ 永 不 朋 尝 ”"。Rust 中 关于 数组 越界 的 行为 ， 
定义 得 非常 清晰 。 相 比 于 C/C++，Rust 消 除 的 是 “未 定义 行 
为 ”(Undefined Behaviour ) 。 


对 于 明显 的 数组 越界 行为 ， 在 Rust 中 可 以 通过 lint 检 查 来 发 现 。 大 家 
可 以 参考 “clippy” 这 个 项 目 ， 它 可 以 检查 出 这 种 明显 的 常量 索引 越界 的 

















现象 。 然 而 ， 总 体 来 说 ， 在 Rust 里 面 ， 靠 编译 阶段 静态 检查 是 无 法 消除 
数组 越界 的 行为 的 。 


一 般 情况 下 ，Rust 不 鼓励 大 量 使 用 "索引 ?操作 。 正 第 的 “索引 ?操作 
都 会 执行 一 次 “边界 检查 ”。 从 执行 效率 上 来 说 ，Rust 比 C/C++ 的 数组 索 
引 效 率 低 一 点 ， 因 为 C/C++ 的 索引 操作 是 不 执行 任何 安全 性 检查 的 ， 它 
们 对 应 的 Rust 代 码 相 当 于 调用 get_unchecked () 函数 。 在 Rust 中 ， 更 加 





地 道 的 做 法 是 尽量 使 用 “和 迭代 器 "方法 。 "和 帮 代 器 ?非常 重要 ， 本 书 将 在 第 
24 章 专门 详细 分 析 ， 下 面 是 使 用 返 代 器 操作 数组 的 一 些 简 单 示例 : 





fn main() { 
use std::iter::Iterator; 


let v = &[10i32, 20, 30, 40, 50]; 














// 如 果 我 们 同时 需要 ijndex 和 内 部 元 素 的 值 , 调用 enumerate( ) 方 法 

for (index, value) in v.iter().enumerate() { 
println!("{} {}", index, value); 

} 


// filter 方 法 可 以 执行 过 滤 , nth 函 数 可 以 获取 第 n 个 元 素 
let item = v.iter().filter(|&x| *x % 2 == 0).nth(2); 
println!i("{:?}", item); 




















Iterator 还 有 许多 有 用 的 方法 ， 合 理 地 组 合 使 用 它们 ， 能 使 程序 表达 
能 力 强 ， 可 读 性 好 ， 安 全 高 效 ， 可 以 满足 我 们 绝 大 多 数 的 需求 。 





6.2 ”字符 串 


字符 串 是 非常 重要 的 第 见 类 型 。 相 比 其 他 很 多 语言 ，Rust 的 字符 串 
显得 有 点 复杂 ， 主 要 是 跟 所 有 权 有 关 。Rust 的 字符 串 涉及 两 种 类 型 ， 一 
种 是 &str， 另 外 一 种 是 String。 














6.2.1 Q&str 


str 是 Rust 的 内 置 类 型 。&str 是 对 str 的 借用 。Rnust 的 字符 串 内 部 默认 
是 使 用 utf-8 编 码 格式 的 。 而 内 置 的 char 类 型 是 4 字 节 长 度 的 ， 存 储 的 内 容 
是 Unicode Scalar Value。 所 以 ，Rust 里 面 的 字符 串 不 能 视 为 char 类 型 的 
数组 ， 而 更 接近 u8 类 型 的 数组 。 实 际 上 str 类 型 有 一 种 方法 : 人 
as_ptr (&self) ->*constu8。 它 内 部 无 须 做 任何 计算 ， 只 需 做 一 个 强制 
类 型 转换 即 可 : 











self as *const Str as *const u8 








这 样 设计 有 一 个 缺点 ， 束 是 不 能 支持 O(1) 时 间 复 杂 上 度 的 索引 操 
作 。 如 果 我 们 要 找 一 个 字符 串 s 内 部 的 第 n 个 字符 ， 不 能 直接 通过 s[n] 得 
到 ， 这 一 点 跟 其 他 许多 语言 不 一 样 。 在 Rust 中 ， 这 样 的 需求 可 以 通过 下 
面 的 语句 实现 : 





s.chars().nth(n) 





它 的 时 间 复 杂 度 是 O Cn) ， 因 为 utf-8 是 变 长 编码 ， 如 果 我 们 不 从 头 
开始 过 一 遍 ， 根 本 不 知道 第 n 个 字符 的 地 址 在 什么 地 方 。 


但 是 ， 综 合 来 看 ， 选 择 utf-8 作 为 内 部 默认 编码 格式 是 缺陷 最 少 的 一 
种 方式 了 。 相 比 其 他 的 编码 格式 ， 它 有 相当 多 的 优点 。 比 如 : 它 是 大 小 
端 无 关 的 ， 它 跟 ASCII 码 兼容 ， 它 是 互联 网 上 的 首选 编码 ， 等 等 。 关 于 
各 种 编码 格式 之 则 的 详细 优 务 对 比 ， 强 烈 建议 大 家 参考 下 面 这 个 网 站 : 





http://utf8everywhere.org/ 


跟 上 一 章 讲 过 的 数组 类 似 ，[T] 是 DST 类 型 ， 对 应 的 str 是 DST 类 型 。 
&[T] 是 数组 切片 类 型 ， 对 应 的 &str 是 字符 串 切片 类 型 。 示 例如 下 : 





fn main() { 
let greeting : &str = "Hel1o"， 
let substr : &str = &greeting[2..]; 
println!("{}", substr); 

} 





编译 ， 执 行 ， 可 见 它 跟 数组 切片 的 行为 很 相似 。 
&str 类 型 也 是 一 个 胖 指 针 ， 可 以 用 下 面 的 示例 证 明 : 





fn main() { 
println!("Size of pointer: {}", std::mem::size of::<*const ()>()); 
println!("Size of &str : {}", std::mem::size_of::<&str>()); 


} 








Size of pointer: 8 
Size of &str ; 16 





它 内 部 实际 上 包含 了 一 个 指 同 字符 串 片 段 头 部 的 指针 和 一 个 长 度 。 
所 以 ， 它 跟 C/C++ 的 字符 串 不 同 : C/C++ 里 面 的 字符 串 以 \0' 结 尾 ， 而 
Rust 的 字符 串 是 可 以 中 间 包 含 \0' 字 符 的 。 


6.2.2 String 


接 下 来 讲 String 类 型 。 它 跟 &str 类 型 的 主要 区 别 是 ， 它 有 管理 内 存 
空间 的 权力 。 关 于 “所 有 权 ” 和 “借用 ”的 关系 ， 在 本 书 第 二 部 分 会 详细 讲 
解 。&str 类 型 是 对 一 块 字符 串 区 间 的 借用 ， 它 对 所 指 癌 的 内 存 空间 没有 
所 有 权 ， 哪 怕 &mut str 也 一 样 。 比 如 : 





lJet greeting : &str = "Hello"; 





我 们 没 办 法 扩大 greeting 所 引用 的 范围 ， 在 它 后 面 增加 内 容 。 但 是 


String 类 型 可 以 。 示 例如 下 : 





fn main() { 
let mut s = String::from("Hello"); 
s.push(' '); 
s.push_str("World."); 
println!i("{}", s); 








这 是 因为 String 类 型 在 堆 上 动态 申请 了 一 块 内 存 空间 ， 它 有 权 对 这 
块 内 存 空间 进行 扩容 ， 内 部 实现 类 似 于 std: : Vec<u8> 类 型 。 所 以 我 们 
可 以 把 这 个 类 型 作为 容纳 字符 串 的 容器 使 用 。 


这 个 类 型 实现 了 Deref<Target=str> 的 trait。 所 以 在 很 多 情况 下 ， 
&String 类 型 可 以 被 编译 器 自动 转换 为 &str 类 型 。 关 于 Deref 大 家 可 以 参 
考 本 书 第 二 部 分 “ 解 引用 ”章节 。 我 们 写 个 小 示例 演示 一 下 : 














fn capitalize(substr: &mut str) { 
substr.make_ascii _ uppercase( ); 


} 


fn main() { 
Jet mut s = String::from("Hello World"); 
capitalize(&mut s); 
println!("{}", s); 





在 这 个 例子 中 ，capitalize 函 数 调 用 的 时 候 ， 形 式 参数 要 求 是 &mnut 
str 类 型 ， 而 实际 参数 是 &mut String 类 型 ， 这 里 编译 器 给 我 们 做 了 自动 类 
型 转换 。 在 capitalize 函 数 内 部 ， 它 有 权 修 改 &mnut str 所 指 同 的 内 容 ， 但 
是 无 权 给 这 个 字符 串 扩 容 或 者 释放 内 存 。 


Rust 的 内 存 管理 方式 和 C++ 有 很 大 的 相似 之 处 。 如 采用 C++ 来 对 
比 ，Rust 的 String 类 型 类 似 于 std: : string， 而 Rust 的 &str 类 型 类 似 于 
std: : string_view。 示 例如 下 : 








#include <iostream> 
#include <string> 
#include <string_view> 


int main() { 
std::string s = "Hello world"; 
std::string _ view v(&s[5], 5); 


std::cout << "Size of string view:" << sizeof(V) << "\n" 
<< "Value: " <<v << std::endl; 





这 样 的 对 比 可 能 会 让 有 C++ 背 景 的 读者 更 容易 理解 一 些 。 


第 7 草 ”模式 解构 


“Pattern Destructure” 是 Rust 中 一 个 重要 且 实 用 的 设计 。 笔 者 暂且 将 
其 翻译 为 “模式 解构 ”"。 注 意 这 里 的 “Destructure” 和 “Destructor” 是 完全 不 
同 的 两 个 单词 ， 代 表 完 全 不 同 的 含义 。“Destructure” 的 意思 是 把 原来 的 
结构 肢解 为 单独 的 、 局 部 的 、 原 始 的 部 分 “Destructor”* 是 指 “ 析 构 器 ””， 
是 一 个 与 “构造 器 ”相对 应 的 概念 ， 是 在 对 象 被 销毁 的 时 候 调 用 的 。 


下 面 举例 说 明 什 么 是 模式 解构 : 














let tuple = (1 i32, false, 3f32); 
let (head, center, tail) = tuple; 








以 上 的 第 三 句 代 码 就 是 一 个 典型 的 “模式 解构 ”。 我 们 可 以 这 么 理 
解 ， 第 一 句 语 是 “从 造 ”% 它 把 三 个 元 素 组 合 到 了 一 起 ， 形 成 了 一 个 
tuple。 而 第 二 名 代码 则 是 刚好 反 过 来 ， 把 一 个 组 合 数据 结构 ， 拆 解 开 
来 ， 分 成 了 三 个 不 同 的 变量 。 在 let 语 句 中 ， 赋 值 号 左边 的 内 容 就 是 本 节 
中 我 们 所 说 的 “模式 ?”， 赋 值 号 右边 的 内 容 束 是 我 们 需要 被 “解构 ”的 内 
容 。 这 个 “模式 ”中 引入 了 三 个 新 的 变量 head、center、tail， 它 们 分 别 绑 
定 了 这 个 tuple 的 三 个 成 员 。 


Rust 中 模式 解构 功能 设计 得 非常 美观 ， 它 的 原则 是 ， 构造 和 解构 遵 
循 类 似 的 语法 ， 我 们 怎么 把 一 个 数据 结构 组 合 起 来 的 ， 我 们 就 怎么 把 它 
拆 解 开 来 。 为 了 更 好 地 说 明 这 个 问题 ， 我 们 再 来 看 一 个 更 复杂 一 点 的 例 
子 。 比 如 ， 我 们 有 一 个 struct， 里 面包 含 另 外 一 个 struct 类 型 : 














Struct T1 (i32, char); 
struct T2 { 

item1i: T1, 

item2: bool, 
} 


fn main() 
{ 


let X = T2 {1{ 


Item1: Ti1(0, 'A'), 
item2: false, 


}; 


let T2 { 
item1i: Ti(value1, value2), 
item2: value3, 


} = x; 


println!i("{} {} {€}", valuei, value2, value3); 








如 前 所 述 ， 我 们 首先 构造 了 一 个 T2 类 型 的 变量 x， 它 内 部 义 租 套 包 
含 了 其 他 的 结构 体 。 实 际 上 ， 我 们 完全 可 以 一 次 性 解构 多 个 层次 ， 直 接 
把 这 个 对 象 内 部 深 人 处 的 元 素 拆 解 出 来 。 第 二 条 let 语 句 ， 就 是 一 个 比较 复 
杂 的 “模式 解构 ”>， 赋 值 号 的 左边 不 仅仅 是 一 个 变量 名 ， 还 是 一 个 完整 
的 “模式 ”， 在 这 个 模式 中 引入 了 三 个 变量 value1、value2、value3， 分 别 
绑 定 到 了 item1 内 部 的 两 个 成 员 以 及 item2 上 。 


编译 ， 执 行 ， 打 印 出 来 的 结果 为 "0 A false"。 
Rust 的 “模式 解构 ”功能 不 仅 出 现在 let 语 句 中 ， 还 可 以 出 现在 match、 


if let、while let、 函 数 调用 、 闭 包 调 用 等 情景 中 。 而 match 具 有 功能 最 强 
大 的 模式 匹配 。 下 面 首先 介绍 match 语 法 。 


7.2 match 


首先 ， 我 们 看 看 使 用 match 的 最 简单 的 示例 : 





enum Direction { 
East, West, South, North 


fn print(x: Direction) 
match x { 
Direction::East => { 
println!("East"),; 


Direction::wWest => { 
println!("West"),; 


Direction::South => { 
println!("South"); 


Direction::North => { 
println!("North"); 


} 

} 

fn main() { 
let x = Direction::East,; 
print (x); 





当 一 个 类 型 有 多 种 取 值 可 能 性 的 时 候 ， 特 别 适合 使 用 match 表 达 
式 。 对 于 这 个 示例 ， 我 们 也 可 以 用 多 个 if-else 表 达 式 完成 类 似 的 功能 ， 
但 是 match 表 达 式 还 有 更 强大 的 功能 ， 下 面 我 们 继续 说 明 。 





7.2.1 exhaustive 


如 果 我 们 把 上 例 中 的 Direction: : North 对 应 的 分 支 删除 : 





match x { 
Direction::East => { 
println!("East"),; 


Direction::West => { 
println! ("West"); 


Direction::South => { 
println!("South"); 








顷 译 ， 出 现 了 编译 错误 : 





error[E0004]: non-exhaustive patterns: North ”not covered 





这 是 因为 Rust 要 求 match 需 要 对 所 有 情况 做 完整 的 、 无 遗漏 的 匹 
配 ， 如 果 漏 反 了 某 些 情况 ， 是 不 能 编译 通过 的 。exhaustive 意 思 是 无 遗 
漏 的 、 穷 尽 的 、 彻 底 的 、 全 面 的 。exhaustive 是 Rust 模 式 匹 配 的 重要 特 
Ri 


有 些 时 候 我 们 不 想 把 每 种 情况 一 一 列 出 ， 可 以 用 一 个 下 划 线 来 表 
达 “ 除 了 列 出 来 的 那些 之 外 的 其 他 情况 ”: 





match x { 
Direction::East => { 
println!("East"); 


Direction::West => { 
println! ("West"); 


Direction::South => { 
println!("South"); 


=> 


{ 
println!("Other"); 





正 因为 如 此 ， 在 多 个 项 目 之 间 有 依赖 关系 的 时 候 ， 在 上 游 的 一 个 库 
中 对 enum 增 加 成 员 ， 是 一 个 破坏 兼容 性 的 改动 。 因 为 增加 成 员 后 ， 很 
可 能 会 导致 下 游 的 使 用 者 match 语 句 编译 不 过 。 为 解决 这 个 问题 ，Rust 
提供 了 一 个 叫 作 non_exhaustive 的 功能 (目前 还 没有 稳定 ) 。 示 例如 
下 











#[non_exhaustivel] 

pub enum Error { 
NotFound, 
PermissionDenied, 
ConnectionRefused, 


} 





上 游 库 作 者 可 以 用 一 个 叫 作 “non_exhaustive” 的 attribute 来 标记 一 个 
enum 或 者 struct， 这 样 在 另外 一 个 项 目 中 使 用 这 个 类 型 的 时 候 ， 无 论 如 
何 都 没 办 法 在 match 表 达 式 中 通过 列举 所 有 的 成 员 实 现 完整 匹配 ， 必 须 
使 用 下 划 线 才能 完成 编译 。 这 样 ， 以 后 上 游 库 里 面 为 这 个 类 型 添加 新 成 
员 的 时 候 ， 就 不 会 导致 下 游 项 目 中 的 编译 错误 了 因为 它 已 经 存在 一 个 默 
认 分 支 匹 配 其 他 情况 。 


7.2.2 ”下划线 


下 划 线 还 能 用 在 模式 匹配 的 各 种 地 方 ， 用 来 表示 一 个 占 位 符 ， 虽 然 
匹配 到 了 但 是 忽略 它 的 值 的 情况 : 





Struct P(f32, f32, f32); 


fn calc(arg: P) -> f32 { 
// 匹配 tuple struct, 但 是 忽略 第 二 个 成 员 的 值 
let P(x, _, y) = arg; 
x * x 十 y * y 

} 

fn main() { 


let t = P(1.0, 2.0, 3.0); 
println!("{}", calc(t)); 





对 于 上 例 ， 实 际 上 我 们 还 能 写 得 更 简略 一 点 。 因 为 函数 参数 本 喘 砚 
具备 “模式 解构 ”功能 ， 我 们 可 以 直接 在 参数 中 完成 解构 : 








struct P(f32, f32, f32); 
// 参数 类 型 是 P, 参数 本 身 是 一 个 模式 , 解构 之 后 , 变量 x、y 分 别 绑 定 了 第 一 个 和 第 三 个 成 员 
fn calc(P(x, _, y): P) -> f32 { 

x * > 4 证 y * y 




















fn main() { 
let t = P(1.0, 2.0, 3.0); 
println!("{}", calc(t)); 





另外 需要 提醒 的 一 点 是 ， 下 划 线 更 像 是 一 个 “关键 字 ”， 而 不 是 普通 
的 “标识 符 ”(identifier) ， 把 它 当 成 普通 标识 符 使 用 是 会 有 问题 的 。 举 
例如 下 : 


fn main() { 
let _ = 1 i32,; 
let x=_+_;， 
println!i("{}", x); 





编译 可 见 ， 编 译 器 并 不 会 把 单独 的 下 划 线 当成 一 个 正常 的 变量 名 处 
理 : 





error: expected expression, found .~ 
--> test.rs:4:13 
| 
4 | let x= _+_; 
| 和 


error[E0425]: cannot find value ‘x in this scope 





如 果 把 下 划 线 后 面 跟 上 字母 、 数 字 或 者 下 划 线 ， 那 么 它 就 可 以 成 为 
一 个 正常 的 标识 符 了 。 比 如 ， 连 续 两 个 下 划 线 _， 就 是 一 个 合法 的 、 正 
常 的 “标识 符 ”。 


let_=x; 和 let_y=x; 具有 不 一 样 的 意义 。 这 一 点 在 后 面 的 析 构 函 

数 "部 分 还 会 继续 强调 。 如 果 变量 x 是 非 Copy 类 型 ，let_=x 的 意思 是 “名 
略 绑 定 "， 此 时 会 直接 调用 x 的 析 构 函数 ， 我 们 不 能 在 后 面 使 用 下 划 线 _ 
读 取 这 个 变量 的 内 容 ， 而 let y=x; 的 意思 是 “所 有 权 转 移 "，_y 是 一 个 正 
常 的 变量 名 ，x 的 所 有 权 转 移 到 了 _y 上 ，_y 在 后 面 可 以 继续 使 用 。 


下 划 线 在 Rust 里 面 用 处 很 多 ， 比 如 : 在 match 表 达 式 中 表示 “其 他 分 
支 "， 在 模式 中 作为 占 位 符 ， 还 可 以 在 类 型 中 做 占 位 符 ， 在 整数 和 小 数 
字面 量 中 做 连接 符 ， 等 等 。 


除了 下 划 线 可 以 在 模式 中 作为 “ 占 位 符 ”， 还 有 两 个 点 .. 也 可 以 在 模 
式 中 作为 “ 占 位 符 ” 使 用 。 下 划 线 表示 省 上 略 一 个 元 系 ， 两 个 点 可 以 表示 省 
略 多 个 元 素 。 比 如 : 














fn main() { 
let x = (1, 2, 3); 
let (a, _) = x; // 模式 解构 
println!("{}", a); 





如 果 我 们 希望 只 匹配 tuple 中 的 第 一 个 元 素 ， 其 他 的 省 略 ， 那 么 用 一 
个 下 划 线 是 不 行 的 ， 因 为 这 样 写 ， 左 边 的 tuple 和 右边 的 tuple 不 匹配 。 修 
改 方案 有 两 种 。 一 种 是 : 























let (a，_，-) = x; // 用 下 划 线 ,那么 个 数 要 匹配 





另 一 种 是 : 

















let (a，..) = x;  // 用 两 个 点 ,表示 其 他 的 全 部 省 略 
let (a，..，b) = x;// 用 两 个 点 ,表示 只 省 略 所 有 元 素 也 是 可 以 的 



























































7.2.3 ”match 也 是 表达 式 


跟 Rust 中 其 他 流程 控制 语法 一 样 ，match 语 法 结构 也 同样 可 以 是 表 
达 式 的 一 部 分 。 示 例如 下 : 





enum Direction { 
East, West, South, North 
} 


fn direction_ to_int(x: Direction) -> i32 


match x { 
Direction::East => 10, 
Direction::West => 20, 
Direction::South => 30, 
Direction: :North => 40, 
} 
} 


fn main() { 
let x = Direction::East,; 
let s = direction to_int(x); 
println!("{}", s); 

} 





match 表 达 式 的 每 个 分 支 可 以 是 表达 式 ， 它 们 要 么 用 大 括号 包 起 
来 ， 要 么 用 逗号 分 开 。 每 个 分 支 都 必须 具备 同样 的 类 型 。 在 此 例 中 ， 这 
个 match 表 达 式 的 类 型 为 32， 在 match 后 面 没 有 分 号 ， 因 此 这 个 表达 式 的 
值 将 会 作为 整个 函数 的 返回 值 传递 出 去 。 


match 除 了 匹配 “结构 ”， 还 可 以 匹配 “ 值 ”: 


1 


fn category(x: i32) { 
match x { 
-1 => println!("negative"), 
9 => printilin!("zero"), 
=> printJln!("positive")， 
=> printilin!("error"), 


} 


fn main() { 
let x = 1; 
category(x); 


} 





我 们 可 以 使 用 或 运算 符 | 来 匹配 多 个 条 件 ， 比 如 : 








fn category(x: i32) { 
match x { 
-1 | 1 => printilin!("true"), 
=> printilin!("false"), 
=> printilin!("error"), 


} 

} 

fn main() { 
let x = 1; 


category(x); 





我 们 还 可 以 使 用 范围 作为 匹配 条 件 ， 使 用 .. 表 示 一 个 前 财 后 开 区 间 
范围 ， 使 用 .= 表示 一 个 财 区间 范围 : 





'a' ..= 'Z' => println!("lowercase"), 
'A' ..= 'Z' => println!("uppercase"), 
_ => println!("something else"), 





7.2.4 Guards 


可 以 使 用 if 作 为 “匹配 看 守 ”(match guards) 。 当 匹配 成 功 且 符合 if 
条 件 ， 才 执行 后 面 的 语句 。 示 例如 下 : 





enum OptionalInt { 


Value(I32)， 
Missing, 


Jet x = OptionalInt::Value(5); 


match x { 
OptionalInt::Value(i) if i > 5 => printilin!("Got an int bigger than five!"), 
OptionalInt::Value(..) => println!("Got an int!"), 
OptionalInt::Missing => printjn!("No such luck."), 


} 





在 对 变量 的 “ 值 ” 进 行 匹 配 的 时 候 ， 编 译 器 依然 会 保证 “完整 无 遗 
漏 ? 检 查 。 但 是 这 个 检查 目前 做 得 并 不 是 很 完美 ， 东 些 情 况 下 会 发 生 误 
报 的 情况 ， 因 为 毕竟 编译 器 内 部 并 没有 一 个 完整 的 数学 解 算 功能 : 











fn main() { 
let x = 10; 


match x { 
i if i > 5 => println!("bigger than five"), 
i if i <= 5 => printiln!("small or equal to five"), 
} 
} 











从 if 条 件 中 可 以 看 到 ， 实 际 上 我 们 已 经 窗 盖 了 所 有 情况 ， 可 惜 还 是 
出 现 了 编译 错误 。 编 译 妖 目前 还 无 法 完美 地 处 理 这 样 的 情况 。 我 们 只 能 
再 加 入 一 条 分 文 ， 单 纯 为 了 避免 编译 错误 : 











_ => unreachable!(), 











编译 器 会 保证 match 的 所 有 分 文 合 起 来 一 定 履 盖 了 目标 的 所 有 可 能 
取 值 范围 ， 但 是 并 不 会 保证 各 个 分 文 是 否 会 有 重 登 的 情况 〈 毕 竟 编 译 器 
不 想 做 成 一 个 完整 的 数学 解 算 器 ) 。 如 果 不 同 分 支 覆 盖 范 围 出 现 了 重 
登 ， 各 个 分 文 之 间 的 先后 顺序 残 有 影响 了 : 














fn intersect(arg: i32) { 
match arg { 
i if i < © => println!("case 1"), 
i if i < 10 => printilin!("case 2"), 
i if i * i < 1000 => println!("case 3"), 
_ => println!("default case"), 


fn main() { 
let x = -1; 
intersect(x); 


} 





如 末 我 们 进行 匹配 的 值 同 时 符合 好 几 条 分 文 ， 那 么 总 会 执行 第 一 
匹配 成 功 的 分 文 ， 忽 略 其 他 分 文 。 


7.2.5 ”变量 绑 定 








我 们 可 以 使 用 @ 符 亏 绑 定 变量 。@ 符 号 前 面 是 新 声明 的 变量 ， 后 面 
是 需要 匹配 的 模式 : 





Jet x = 1; 


match x { 
eQ@1l1..=5 => println!("got a range element {}", e), 
_ => println!("anything"), 








当 一 个 Pattern 共 套 层 次 比较 多 的 时 候 ， 如 果 我 们 需要 匹配 更 深层 次 
作为 条 件 ， 硕 望 绑 定 上 面 一 层 的 数据 ， 惑 需要 像 下面 这 样 与 : 





#![feature(exclusive_range_pattern)] 


fn deep_match(v: Option<Option<i32>>) -> Option<i32> { 
match v { 
// r 绑 定 到 的 是 第 一 层 0ption 内 部 ,r 的 类 型 是 0ption<i32> 
// 与 这 种 写法 含义 不 一 样 : Some (Some(r)) if (1..10).contains(r) 
Some(r @ Some(1..10)) => r, 
_ => None, 








} 


fn main() { 
let x = Some(Some(5)); 
println!("{:?}", deep_match(x)); 


let y = Some(Some(100)); 
println!("{:?}", deep_match(y)); 





如 末 在 使 用 @ 的 同时 使 用 ， 需 要 保证 在 每 个 条 件 上 都 绑 定 这 个 名 


和 


子 -: 


let x = 5; 


match x { 
e@Q1l1..5|.e@8.. 10 => println!("got a range element {}", e), 
_ => println!("anything"), 

} 





7.2.6 ref 和 mut 


如 采 我 们 需要 绑 定 的 是 被 匹配 对 象 的 引用 ， 则 可 以 使 用 ref 关 键 字 : 





let x = 5 132) 


match x { 
ref r => println!("Got a reference to {}",， r)，// 此 时 r 的 类 型 是 `&i32、 
} 





之 所 以 在 东 些 时 候 需要 使 用 ref， 是 因为 模式 匹配 的 时 候 有 可 能 发 生 
变量 的 所 有 权 转 移 ， 使 用 ref 就 是 为 了 避免 出 现 所 有 权 转 移 。 


那么 ref 关 键 字 和 引用 符号 & 有 什么 关系 呢 ? 考虑 以 下 代码 中 变量 绑 


定 x 分 别 是 什么 类 型 ? 





let x = 5 i32; // i32 
let x = &5 i32; // &i32 
Jet ref x = 5 i32; // ?7?? 
Jet ref x = &5_ i32; // ?7?? 





注意 : ref 是 “模式 ”的 一 部 分 ， 它 只 能 出 现在 赋值 号 左边 ， 而 信 符 号 
古 借用 运算 符 ， 是 表达 式 的 一 部 分 ， 它 只 能 出 现在 赋值 号 右边 。 


出 
为 了 搞 清楚 这 些 变量 绑 定 的 分 别 是 什么 类 型 ， 我 们 可 以 把 变量 的 类 
型 信息 打印 出 来 看 看 。 有 两 种 方案 : 


利用 编译 器 的 错误 信息 来 帮 有 我 们 理解 ; 
利用 标准 库 里 面 的 intrinsic 函 数 打印 。 
方案 一 ， 不 例如 下 : 


AN 





// 这 个 函数 接受 一 个 unit 类 型 作为 参数 
fn type_id(_: ()) {} 


fn main() { 
let ref x = 5_i32,; 
// 实际 参数 的 类 型 肯定 不 是 unit, 此 处 必定 有 编译 错误 , 通过 编译 错误 , 我 们 可 以 看 到 实 参 的 具体 类 型 
type_id(x); 













































































这 里 我 们 写 了 一 个 不 做 任何 事情 的 函数 type_id。 它 接收 一 个 参数 ， 
类 型 是 () ， 我 们 在 main 函 数 中 调用 这 个 函数 ， 肯 定 会 出 现 类 型 不 匹配 
的 编译 错误 。 错 误 信息 为 : 





error[E0308]: mismatched types 
--> test.rs:5:13 
| 
5 | type_id(x); 
| 人 ^ expected (), found &i32 
| 


note: expected type ‘(). 
found type ‘&i32. 





这 个 错误 信息 正 是 我 们 想 要 的 内 容 。 从 中 我 们 可 以 看 到 我 们 感 兴趣 
的 变量 类 型 。 


方案 二 ， 不 例如 下 : 





#![feature(core_intrinsics)] 


fn print_type_name<T>(_arg: &T) { 
unsafe { 
println!("{}", std::intrinsics::type_name::<T>()); 


} 
fn main() { 


let ref x = 5_i32,; 
print_type_name(&x); 





利用 标准 库 里 面 提供 的 type_name 函 数 ， 可 以 打印 出 变量 的 类 型 信 


从 以 上 方案 可 以 看 到 ，let ref x=5 i32;， 和 ]et x=&5 i32; 这 两 条 语 
句 中 ， 变 量 x 是 同样 的 类 型 &i32。 





同 理 ， 我 们 可 以 试验 得 出 ，let ref x=&5 i32;， 语句 中 ， 变 量 x 绑 定 
的 类 型 是 &&i32。 对 于 更 复杂 的 情况 ， 读 者 可 以 用 类 似 的 办 法 做 试验 ， 
多 看 看 各 种 情况 下 具体 的 类 型 是 什么 。 


ref 关 键 字 是 “模式 ”的 一 部 分 ， 不 能 修饰 赋值 号 右边 的 值 。let x=ref 
5 i32; 这 样 的 写法 是 错误 的 语法 。 


mut 关 键 字 也 可 以 用 于 模式 绑 定 中 。mut 关 键 字 和 ref 关 键 字 一 样 ， 
是 “模式 ”的 一 部 分 。Rust 中 ， 所 有 的 变量 绑 定 默认 都 是 “不 可 更 改 ” 的 。 
只 有 使 用 了 mnut 修 饰 的 变量 绑 定 才 有 修改 数据 的 能 力 。 最 简单 的 例子 如 











| 





fn main() { 
let x = 1; 
x = 2; 


} 





编译 错误 ， 错 误 信 息 为 : error: re-assignment of immutable variable 


Xx。 我 们 必须 使 用 let mut x=1; ， 才 能 在 以 后 的 代码 中 修改 变量 绑 定 x。 
使 用 了 mnut 修 饰 的 变量 绑 定 ， 可 以 重新 绑 定 到 其 他 同类 型 的 变量 。 





fn main() { 
let mut v = vec![1i32, 2, 3]; 
v = vec![4i32, 5, 6]; // 重新 绑 定 到 新 的 Vec 
v = vec![1.0f32, 2, 3]; // 类 型 不 匹配 ,不 能 重新 绑 定 














} 








重新 绑 定 与 前 面 提 到 的 “变量 遮蔽 ”(shadowing) 是 完全 不 同 的 作 
用 机 制 。“ 重 新 绑 定 ”要求 变量 本 身 有 mnut 修 饰 ， 并 且 不 能 改变 这 个 变量 
的 类 型 。 “变量 遮 珊 ?要 求 必 须 重 新 声明 一 个 新 的 变量 ， 这 个 新 变量 与 老 
变量 之 间 的 类 型 可 以 毫 无 关系 。 

Rust 在 “可 变性 ?方面 ， 默 认为 不 可 修改 。 与 C++ 的 设计 刚好 相反 。 
C++ 默认 为 可 修改 ， 使 用 const 关 键 字 修饰 的 才 变 成 不 可 修改 。 


mnut 关 键 字 不 仅 可 以 在 模式 用 于 修饰 变量 绑 定 ， 还 能 修饰 指针 《〈 引 
用 ) ， 这 里 是 很 多 初学 者 冲 币 搞 混 的 地 方 。mnut 修 饰 变 量 绑 定 ， 与 &mnut 
型 引用 ， 是 完全 不 同 的 意义 。 





























let mut x: &mut i32; 
// ^1 人 2 








以 上 两 处 的 mut 含 义 是 不 同 的 。 第 1 处 mut， 代 表 这 个 变量 x 本 里 可 
变 ， 因 此 它 能 够 重新 绑 定 到 另外 一 个 变量 上 去 ， 有 具体 到 这 个 示例 来 说 ， 
就 是 指针 的 指向 可 以 变化 。 第 2 处 mut， 修 饰 的 是 指针 ， 代 表 这 个 指针 对 
于 所 指 问 的 内 存 具 有 修改 能 力 ， 因 此 我 们 可 以 用 *x=1; 这 样 的 语句 ， 改 
变 它 所 指向 的 内 存 的 值 。 


mnut 关 键 字 不 像 想象 中 那么 简单 ， 我 们 会 经 名 碰 到 与 mut 有 关 的 各 种 
编译 错误 。 在 本 节 中 ， 只 是 简单 介绍 了 它 的 语法 ， 关 于 mut 关 键 字 代 表 
的 深层 含义 ， 及 其 正确 使 用 方法 ， 在 本 书 第 二 部 分 还 会 有 详细 插 述 。 


至 于 为 什么 有 些 场景 下 ， 我 们 必须 使 用 ref 来 进行 变量 绑 定 ， 背 后 的 
原因 跟 *move” 语 义 有 关 。 关 于 变量 的 生命 周期 /所 有 权 / 借 用 /move 等 概 
念 ， 请 参考 本 书 第 二 部 分 。 下 面 举 个 例子 : 








fn main() { 
let mut x : Option<String> = Some("hello".into()); 
match x { 
Some(i) => i.push_str("world"), 
None => println!("None"), 


} 


println!i("{:?2}", x); 











这 段 代 人 码 编译 器 会 提示 编译 错误 ， 第 一 个 原因 是 ， 局 部 变量 i 是 不 
可 变 的 ， 所 以 它 无 权 调用 push_str 方 法 。 我 们 可 以 修改 为 Some (muti) 
再 次 编译 。 还 是 会 发 生 编译 错误 。 这 次 提示 的 是 ，“use of partially 
moved value x”。 因 为 编译 器 认为 这 个 match 语 句 把 内 部 的 String 变 量 移 
动 出 来 了 ， 所 以 后 续 的 打印 x 的 值 是 错误 的 行为 。 为 了 保证 这 个 match 语 
句 不 发 生 移动 ， 我 们 需要 把 这 个 模式 继续 修改 为 Some (ref muti) ， 这 
二 编译 通过 了 。 


这 个 问题 还 有 更 简单 的 修复 方式 ， 就 是 把 match x 改 为 match &mut 





fn main() { 
let mut x : Option<String> = Some("hello".into()); 


match &mut x { 
Some(i) => i.push_str("world"), 
None => println!("None"), 


} 


println!i("{:?}", x); 





在 这 种 情况 下 ， 编 译 器 没有 报错 ， 是 因为 我 们 对 指针 做 了 模式 区 
配 ， 编 译 器 很 聪明 地 推理 出 来 了 ， 变 量 i 必 须 是 一 个 指针 类 型 ， 所 以 它 
帮 我 们 自动 加 了 ref mut 模 式 ， 它 通过 自动 类 型 推导 自己 得 出 了 结论 ， 认 
为 的 类 型 是 &mut String。 这 是 编译 器 专门 做 的 一 个 辅助 功能 。 在 很 多 
时 候 ， 特 别 是 类 型 艇 套 层 次 很 多 的 时 候 ， 处 处 都 要 关心 哪个 pattern 是 不 
是 要 加 个 mut 或 者 ref， 其 实 是 个 很 烦人 的 事情 。 有 了 这 个 功能 ， 用 户 就 
不 用 每 次 都 写 矿 烦 的 mut 或 者 ref， 在 一 些 显而易见 的 情况 下 ， 编 译 器 上 自 
动 来 帮 有 我 们 合理 地 使 用 mnut 或 者 ref。 读 者 可 以 用 我 们 前 面 实现 的 
print_type_name 试 试 ， 用 Some (i) 模式 ， 以 及 用 Some (ref muti) 模 
式 ， 变 量 i 的 类 型 分 别 是 什么 。 结 论 是 类 型 一 样 。 因 为 在 我 们 不 明确 写 
出 来 ref mut 模 式 的 时 候 ， 编 译 器 帮 我 们 做 了 更 合理 的 自动 类 型 推导 。 








7.3 if-let 和 while-let 





Rust 不 仅 能 在 match 表 达 式 中 执行 “模式 解构 ”， 在 let 语 句 中 ， 也 可 以 
应 用 同样 的 模式 。Rust 还 提供 了 if-let 语 法 糖 。 它 的 语法 为 if let 
PATTERN=EXPRESSION{BODY}。 后 面 可 以 跟 一 个 可 选 的 else 分 支 。 


比如 ， 我 们 有 一 个 类 型 为 Option<T> 的 变量 optVal， 如 果 我 们 需要 
取出 里 面 的 值 ， 可 以 采用 这 种 方式 : 





match optVal { 
Some(x) => { 
doSomethingwith(x)， 


} 
= > {} 





这 样 做 语法 比较 见长 ， 从 变量 optVal 到 执行 操作 的 函数 有 两 层 缩 
进 ， 我 们 还 必须 写 一 个 不 做 任何 操作 的 语句 块 才能 满足 语法 要 求 。 换 一 
种 方式 ， 通 过 Option 类 型 的 方法 ， 我 们 可 以 这 么 做 : 
































if optVal.is some() { // 首先 判断 它 一 定 是 Some(_) 
let x = optVal.unwrap(); // 然后 取出 内 部 的 数据 
doSsomethingwith(x); 


} 





从 视觉 上 来 看 ， 代 码 缩 进 层次 减少 到 了 一 层 。 但 是 它 在 运行 期 实际 
上 判断 了 两 次 optVal 里 面 是 否 有 值 : 第 一 次 是 is_some () 函数 ， 第 二 次 
是 unwrap 〈) 函数 。 从 执行 效率 上 来 说 是 降低 了 的 。 而 使 用 if-let 语 法 ， 
则 可 以 这 么 做 : 








if let Some(x) = optVal { 
doSomethingwith(x)， 
} 





这 其 实 是 一 个 简 蛙 的 语法 糖 ， 其 背后 执行 的 代码 与 match 表 达 式 相 
比 ， 并 无 效率 上 的 差别 。 它 跟 match 的 区 别 是 : match 一 定 要 完整 匹配 ， 
ilet 只 匹配 感 兴趣 的 菜 个 特定 的 分 文 ， 这 种 情况 下 的 写法 比 match 简 单 





点 。 同 理 ，while-let 与 if-let 一 样 ， 提 供 了 在 while 语 句 中 使 用 “模式 解 
构 ” 的 能 力 ， 此 处 就 不 再 举例 。 


if-let 和 while-let 还 支持 模式 的 “或 ”操作 (此 功能 目前 尚未 在 编译 器 
中 实现 ) 。 比 如 ， 我 们 有 如 下 enum 定 义 : 





enum E<T> { 
A(T), B(T), C, D, E, F 
} 





如 果 我 们 需要 匹配“C 或 者 D”"， 那 么 可 以 这 样 写 : 





let r = if let C | D=x{1} else{2}; 





这 段 代码 等 同 于 : 





let r = match x { 
C | D => 1， 
=> 2/ 


} 








在 这 个 匹配 过 程 中 还 可 以 有 变量 绑 定 ， 比 如 : 





while let A(x) | B(x) = expr { 
do_something(x); 
} 





这 段 代码 等 同 于 : 





match expr { 
A(x) | B(x) => do_something(x), 
= 


} 





7.4 函数 和 闭 包 参 数 做 模式 解构 


示例 如 下 。 一 个 函数 接受 一 个 结构 体 参 数 ， 可 以 直接 在 参数 这 里 做 
模式 解构 : 





Struct T { 
Item1: char, 
item2: bool, 


fn test( T{item1i: arg1, item2: arg2} : T) { 
println!("{} {}", argi, arg2); 


fn main() 
let x=TH{ 
item1i: 'A', 
item2: false, 
}; 
test(x); 


ee | 


7.5” 忆 结 


“模式 解构 ”是 Rust 中 较为 复杂 的 一 个 功能 ， 但 是 非常 实用 。 
Rust 的 “模式 解构 ”功能 在 语法 上 具有 民 好 的 一 致 性 和 扩展 性 ; 


:Rust 的 “模式 解构 ”功能 不 仅 出 现在 match 语 句 中 ， 还 可 以 出 现在 
let、if-let、while-let、 子 数 调 用 、 闭 包 调 用 等 情景 中 ; 


:Rust 的 “模式 解构 ”功能 可 以 应 用 于 各 种 数据 类 型 ， 包 括 但 不 限于 
tuple、struct、enum 等 ， 暂 时 在 稳定 版 中 不 文 持 slice 的 模式 匹配 ; 


.Rust 的 “模式 解构 ”功能 要 求 “ 无 遗漏 ”的 分 析 (exhaustive case 
analysis) ， 确 保 不 会 因为 不 小 心 而 漏 掉 某 些 情况 ; 


Rust 的 “模式 解构 "与 Rust 的 核心 所 有 权 管 理 功能 完全 相 容 。 











第 8 章 ”深入 类 型 系统 


Rust 的 类 型 系统 实际 上 是 一 种 代数 类 型 系统 (Algebraic data 
type) 。 它 在 数学 上 是 有 严格 定义 的 ， 非 常 严谨 的 一 套 理论 。 本 章 试 图 
用 一 种 比较 通俗 的 语言 ， 简 单 地 解释 一 下 什么 是 代数 类 型 系统 ， 我 们 应 
该 如 何 理解 它 ， 以 及 和 它 给 Rust 带 来 了 哪些 优势 。 


8.1 代数 类 型 系统 


代数 ， 我 们 以 前 都 学 过 。 比 如 ， 给 定 一 个 整数 x， 我 们 可 以 对 它 执 
行 一 些 数 学 运算 ， 像 加 法 、 乘 法 之 类 的 : 


X + 工 
2 * X 


我 们 还 可 以 从 中 总 结 出 一 些 规律 ， 比 如 ， 任 何 一 个 整数 与 0 之 和 等 
于 它 本 身 ， 任 何 数 与 0 之 积 等 于 0， 任 何 一 个 整数 与 1 之 积 等 于 它 本 喘 。 
用 数学 语言 描述 ， 可 以 这 样 写 : 








在 代数 里 面 ， 我 们 的 变量 x 代 表 的 是 某 个 集合 内 的 数字 ， 执 行 的 操 
作 一 般 是 加 减 乘 除 一 类 的 数学 运算 。 而 对 应 到 代数 类 型 系统 上 ， 我 们 可 
以 把 类 型 类 比 为 代数 中 的 变量 ， 把 类 型 之 间 的 组 合 关系 类 比 为 代数 中 的 


数学 运算 。 


我 们 可 以 做 这 样 一 个 假定 ， 一 个 类 型 所 有 取 值 的 可 能 性 叫 作 这 个 类 
型 的 “基数 ”(cardinality) 。 那 么 在 此 基础 上 ， 我 们 可 以 得 出 结论 最 简 
单 的 类 型 unit() 的 基数 就 是 1， 它 可 能 的 取 值 范围 只 能 是 〈) 。 再 比如 
说 ，bool 类 型 的 基数 就 是 2， 可 能 的 取 值 范围 有 两 个 ， 分 别 是 true 和 
false。 对 于 i32 类 型 ， 它 的 取 值 范 围 是 232， 我 们 用 Cardinality 〈i32) 来 
代表 i32 的 基数 。 


我 们 把 多 个 类 型 组 合 到 一 起 形成 新 的 复合 类 型 ， 这 个 新 的 类 型 就 会 
有 新 的 基数 。 如 果 两 个 类 型 的 基数 是 一 样 的 ， 那 么 我 们 可 以 说 它们 携带 
0 我 们 也 可 以 说 它们 是 “ 同 构 ”* 的 。 下 面 是 一 个 典 
型 的 例子 : 











type T1 = [i32; 2]; 
type T2 = (i32, i32); 
Struct T3(i32, i32); 


Struct T4 { 
fieldi: i32, 
field2: i32, 

} 








上 面 出 现 了 四 个 类 型 ， 在 实践 中 ， 它 们 不 是 同一 个 类 型 ， 是 无 法 通 
用 的 。 但 是 从 数学 上 讲 ， 这 四 个 类 型 表达 出 来 的 信息 量 是 完全 一 样 的 ， 
它们 都 只 能 装 下 两 个 132 类 型 的 成 员 。 它 们 的 基数 都 是 Cardinality (i32) 
*Cardinality (i32) 。 


tuple、struct、tuple struct 这 几 种 类 型 ， 实 质 上 是 同样 的 内 存 布局 ， 
区 别 仅仅 在 于 是 否 给 类 型 及 成 员 起 了 名 字 。 这 几 个 类 型 都 可 以 类 比 为 代 
数 中 的 “ 求 积 ”运算 。 没 有 成 员 的 tuple 类 型 ， 它 的 基数 就 是 1。 同 理 ， 任 
意 一 个 空 struct 类 型 ， 基 数 也 是 1， 它 们 都 可 以 类 比 为 代数 运算 中 的 数字 
1。 

















么 如 果 struct 里 面 有 多 个 成 员 》 比如 : 





struct Rf{ 
Var1 : bool, 
Var2 : bool, 


} 





R 类 型 包括 了 两 个 成 员 。 分 别 是 varl1 和 var2。 它 的 基数 是 : 





Cardinality(R) = Cardinality(var1) * Cardinality(var2) = 2*2=4 





如 果 我 们 在 结构 体 里 面 加 入 一 个 unit 类 型 的 成 员 : 





struct Prod { 
fieldi: i32, 
field2: (), 
} 











这 个 field2 成 员 实 际 上 对 这 个 结构 体 没 有 带 来 什么 贡献 ， 它 并 没有 
带 来 额外 的 信息 量 : 





Cardinality(Prod) = Cardinality(field1) * 1 = Cardinality(i32) 











对 于 数组 类 型 ， 可 以 对 应 为 每 个 成 员 类 型 部 相同 的 tuple 类 型 (或 者 
struct 是 一 样 的 ) 。 用 数学 公式 类 比 ， 则 比较 像 乘 方 运算 。 


Rust 中 的 enum 类 型 就 相当 于 代数 中 的 “ 求 和 ”运算 。 比 如 ， 某 个 类 型 
可 以 代表 “东南 西北 ”四 个 方向 ， 我 们 可 以 如 下 设计 : 





enum Direction { 
North, East, South, West 
} 








它 可 能 的 取 值 范围 是 四 种 可 能 性 ， 它 的 基数 就 是 4。 我 们 可 以 把 它 
看 作 是 四 个 无 成 员 的 struct 的 “或 ?关系 。 





Cardinality(Direction) = Cardinality(North) + Cardinality(East ) 
+ Cardinality(South) + Cardinality(West) 
三 未 





实际 上 ， 我 们 甚至 可 以 将 内 置 的 bool 类 型 定义 为 一 个 标准 库 中 的 


enum: 





enum Bool { True, False } 





生 ~ 目前 的 内 置 bool 类 型 表达 能 力 上 有 是 没有 什么 
其 别 的 。 


标准 库 中 有 一 个 极其 常见 的 类 型 叫 作 Option<T>， 它 是 这 么 定义 
的 ; 





enum Option<T> { 
None, 
Some(T), 








由 于 它 实 在 是 太 常 用 ， 标 准 库 将 Option 以 及 它 的 成 员 Some、None 
都 加 入 到 了 Prelude 中 ， 用 户 甚至 不 需要 use 语 句 声 明 就 可 以 直接 使 用 。 
其 中 T 是 一 个 泛 型 参数 ， 在 使 用 的 时 候 可 以 被 蔡 换 为 实际 类 型 。 例 如 ， 
Option<i32> 类 型 实际 上 等 同 于 : 








enum Option<i32> { 





Some(i32), 
None 
} 
因此 它 的 基数 是 : 





Cardinality(Option<i32>) = Cardinality(i32) + 1 





同 理 ， 我 们 可 以 得 出 一 个 空 的 enpum， 基 数 是 0。 


通过 上 文中 的 示例 ， 我 们 可 以 为 “代数 类 型 系统 "和 “代数 ”建立 一 个 
直观 的 类 比 天 系 。 空 的 enum 可 以 类 比 为 数字 0;，unit 类 型 或 者 空 结 构 体 
可 以 类 比 为 数字 1; enum 类 型 可 以 类 比 为 代数 运算 中 的 求 和 ; tuple、 
struct 可 以 类 比 为 代数 运算 中 的 求 积 ;数组 可 以 类 比 为 代数 运算 中 的 乘 
方 。 同 理 ， 我 们 还 能 继续 做 更 多 的 类 比 。 


enum 类 型 的 每 个 成 员 还 允许 包含 更 多 关联 数据 : 








enum Message { 
Quit, 
ChangeColor (i32, i32, i32), 
Move { x: i32, y: i32 } 

} 





这 就 好 比 enum 的 每 个 成 员 还 可 以 是 tuple 或 者 struct。 类 比 到 代数 ， 
相当 于 加 法 乘法 混合 运算 : 





Cardinality(Message) = Cardinality(Quit) + Cardinality(ChangeColor) + Cardinality(Mc 
= 1 + Cardinality(i32)^3 + Cardinality(i32)^2 
// 此 处 用 ^ 代表 乘 方 , 不 是 异 或 





























加 法 共有 交换 紊 ， 同 理 ，enum 中 的 成 员 交 换 位 置 ， 也 不 会 影响 它 
的 表达 能 力 ; 乘法 具有 交换 率 ， 同 理 ，struct 中 的 成 员 交 换 位 置 ， 也 不 
影响 它 的 表达 能 


乘法 具有 结合 律 : xx (y*z) = (x*y) *z， 同 理 ， 对 于 tuple 类 型 
(A，(B,，C) ) 和 (A,，B) ，C) 的 表达 能 力 是 一 样 的 。 





继续 列 下 去 ， 我 们 还 能 做 出 更 多 的 类 比 ， 这 是 一 个 非常 庞大 的 话 
题 。 读 者 可 以 到 网 上 搜索 更 多 、 更 详尽 的 关于 ADT 的 讲解 文章 。 下 面 我 
们 讲 一 下 Never type 这 个 类 型 。 


8.2 Never Type 


如 有 果 我 们 考虑 一 个 类 型 在 机 器 层面 的 表示 方式 ， 一 个 类 型 占用 的 bit 
位 数 可 以 决定 它 能 携带 多 少 信 息 。 假 设 我 们 用 bits_of (T) 代表 类 型 工 占 
用 的 bit 位 数 ， 那 么 2Abits_of (T)〉=Cardinality(T) 。 反 过 来 ， 我 们 可 以 
得 出 结论 ， 存 储 一 个 类 型 需要 的 bit 位 数 等 于 bits_ of (T) 
=log2 〈Cardinality (CT) ) 。 比 如 说 ，bool 类 型 的 基数 为 2， 那 么 在 内 存 
中 表示 这 个 类 型 需要 的 bit 位 应 该 为 bits_of (bool) =log2 (2) =1， 也 就 
是 1 个 bit 就 足够 表达 。 

我 们 前 面 已 经 看 到 了 ， 在 代数 类 型 系统 中 有 一 些 比较 特殊 的 类 型 。 

像 unit 类 型 和 没有 成 员 的 空 struct 类 型 ， 都 可 以 类 比 为 代数 中 的 数字 
1。 这 样 的 类 型 在 内 存 中 实际 需要 占用 的 空间 为 bits_of ( () ) 
=log2 〈1) =0。 也 就 是 说 ， 这 样 的 类 型 实际 上 是 0 大 小 的 类 型 。 这 样 的 
性 质 有 很 多 好 处 ， 比 如 ，Rust 里 面 HashSet 的 定义 方式 为 : 








pub struct HashSet<T，S = RandomState> { 
map: HashMap<T, (), S>, 
} 





也 就 是 说 ， 只 要 把 HashMap 中 存 的 键 值 对 中 的 “ 值 ” 指 定 为 unit 类 型 
就 可 以 了 。 这 个 设计 和 我 们 的 思维 模型 是 一 臻 的 。 所 谓 的 HashSet， 就 
是 只 有 key 没 有 value 的 HashMap。 如 果 我 们 没有 真正 意义 上 的 0 大 小 类 
型 ， 这 个 设计 是 无 法 做 到 如 此 简洁 的 。 


i 没有 任何 成 员 的 空 enqum 类 型 ， 都 可 以 类 比 为 代数 中 的 数字 0， 例 
0D: 





enum Never {} 





这 个 Never 没 有 任何 成 员 。 如 果 声 明 一 个 这 种 类 型 的 变量 ，let 


没有 提供 任何 语法 为 这 样 的 类 型 构造 出 变量 。 这 样 的 类 型 在 Rust 类 型 系 
统 中 的 名 字 叫 作 never type， 它 们 有 一 些 属性 是 其 他 类 型 不 具备 的 : 





它们 在 运行 时 根本 不 可 能 存在 ， 因 为 根本 没有 什么 语法 可 以 构造 
出 这 样 的 变量 ; 


“Cardinality (Never) =0; 


:考虑 它 需 要 占用 的 内 存 空间 bits_of (Never) =log2 (0) =-oo， 也 就 
是 说 逻辑 上 是 不 可 能 存在 的 东西 ; 


处 理 这 种 类 型 的 代码 ， 根 本 不 可 能 执行 ; 
-返回 这 种 类 型 的 代码 ， 根 本 不 可 能 返回 ; 
它们 可 以 被 转换 为 任意 类 型 。 

这 些 有 什么 意义 呢 ， 我 们 来 看 以 下 代码 : 














Joop { 


let x : i32 = if cond { 1 } else { continue; }; 


我 们 知道 ， 在 Rust 中 ，if-else 也 是 表达 式 ， 而 且 每 个 分 支 表 达 式 类 
型 必须 一 致 。 这 种 有 continue 的 情况 ， 类 型 检查 是 怎样 通过 的 呢 ? 如 果 
我 们 把 continue 语 名 的 类 型 指定 为 never 类 型 ， 那 么 一 切 就 都 顺理成章 
了 。 因 为 never 类 型 可 以 转换 为 任意 类 型 ， 所 以 ， 它 可 以 符合 与 计 分 文 的 
类 型 相 一 致 的 规定 。 它 根本 不 可 能 返回 ， 所 以 执行 到 else 分 文 的 时 候 ， 
接 下 来 根本 不 会 执行 对 变量 x 的 赋值 操作 ， 会 进入 下 一 次 的 循环 。 如 果 
这 个 分 文大 括号 内 部 continue 后 面 还 有 其 他 代码 ， 编 译 器 可 以 很 容易 判 
断 出 来 ， 它 后 面 的 代码 是 永远 不 可 能 执行 的 死 代码 。 一 切 都 在 类 型 系统 
层面 得 到 了 统一 。 


所 以 说 ，never 类 型 是 Rust 类 型 系统 中 不 可 缺少 的 一 部 分 。 与 unit 类 
型 类 似 ， 一 般 我 们 用 空 ttple〈) 代表 unit 类 型 ，Rust 里 面 其 实 也 有 一 个 
专门 的 类 型 来 表示 never， 也 就 是 我 们 前 面 提 到 过 的 感叹 号 ! 。 上 所谓 
的 “diverging function” 就 是 一 个 返回 never type 的 函数 。 在 早期 版 本 中 ， 
Rust 的 做 法 是 把 diverging function 做 特殊 处 理 ， 使 得 它 在 分 文 结 构 表达 
式 的 类 型 检查 能 够 通过 ， 而 没有 把 它 当 成 真正 意义 上 的 类 型 。 后 来 ， 有 
一 个 RFC 1216 对 这 个 never type 做 了 完整 的 设计 ， 才 真正 将 它 提升 为 一 














个 类 型 。 而 且 ， 直 到 编写 本 书 时 候 的 1.19 厂 本， 这 个 功能 的 完整 实 蔬 
还 没有 完全 做 完 。 

除了 在 数学 形式 上 的 统一 ， 以 及 显而易见 的 对 分 文 结构 表达 式 的 类 
型 检查 有 好 处 之 外 ， 一 个 完整 的 never type 对 于 Rust 还 有 一 些 其 他 的 现实 
意义 。 下 面 举 几 个 例子 来 说 明 。 

场景 一 : 可 以 使 得 泛 型 代码 兼容 diverging function 


比如 ， 一 个 这 样 的 泛 型 方法 接受 一 个 泛 型 函数 类 型 作为 参数 ， 可 


日 
XE : 








fn main() { 
fn call_fn<T, F: Fn(i32)->T> (f: F, arg: i32) ->T t f(arg) } 

// 如 果 不 把 ! 当成 一 个 类 型 ,那么 下 面 这 句 话 会 出 现 编译 错误 ， 姑 为 只 有 类 型 才能 蔡 换 类 型 参数 
call fn(std::process::exit, 0); 

} 






































场景 二 : 更 好 的 死 代码 检查 





let t = std::thread::spawn(|| panic!("nope")); 
t.join().unwrap(); 
println!("hello"); 





如 果 我 们 有 完整 的 never 类 型 支持 ， 那 么 编译 器 应 该 可 以 推理 出 闭 
包 的 返回 类 型 是 ! ， 而 不 是 () ， 因 此 tjoin 〈) .unwrap〈) 会 产生 一 
个 ! 类 型 ， 编 译 器 因此 可 以 检查 出 printIn 永 远 不 可 能 执行 。 

场景 三 : 可 以 用 更 好 的 方式 表达 “不 可 能 出 现 的 情况 ” 


标准 库 中 有 一 个 trait 岂 FromStr， 它 有 一 个 关联 类 型 代表 错误 ; 





pub trait FromStr { 

type Err; 

fn from_str(S: &str) -> Result<Self, Self::Err>; 
} 





如 果菜 些 类 型 调用 from_str 方 法 永远 不 会 出 错 ， 那 么 这 个 Err 类 型 可 
以 指定 为 ! 。 


nn | 


Struct T(String); 


impl FromStr for T { 
type Err = !; 


fn from_str(S: &str) -> Result<T, !> { 
Ok(T(String::from(s))) 
} 





对 于 错误 处 理 ， 我 们 可 以 让 Result 退 化 成 没有 错误 的 情况 : 





use std::str::Fromstr; 
use std::mem::{size of, size of val}; 


Struct T(String); 


imp FromStr for T { 
type Err = !; 


fn from_str(s: &str) -> Result<T, !> { 
Ok(T(String::from(s))) 


fn main() { 
let r: Result<T, !> = T::from str("hello"); 
println!("Size of T: {}", Size_of::<T>()); 
println!("Size of Result: {}", Size of _vall(&r)); 
// 将 来 甚至 应 该 可 以 直接 用 let 语句 进行 模式 匹配 而 不 发 生 编 译 错误 
// 因为 编译 器 有 能 力 推理 出 Err 分 支 没 必要 存在 
// let Ok(T(ref s)) = r; 
// printin!("{}", Ss); 










































































这 里 其 实 根本 不 需要 考虑 Er 的 情况 ， 因 为 Er 的 类 型 是 ! ， 所 以 哪 
怕 match 语 句 中 只 有 Ok 分 文 ， 编 译 占 也 可 以 判定 其 为 “完整 匹配”。 


8.3 ”再 谈 Option 类 型 


Rust 中 的 Option 类 型 解决 了 许多 编程 语言 中 的 “ 空 指针 ”问题 。 


在 目前 的 许多 编程 语言 中 ， 都 存在 一 个 很 有 意思 的 特殊 指针 (或 者 
引用 ) ， 它 代表 指向 的 对 象 为 “ 空 ”， 名 字 一 般 叫 作 null、nil、None、 
Nothing、nullptr 等 。 这 个 空 指 针 看 似 简单 ， 但 它 引 发 的 问题 却 一 点 也 不 
少 。 空 指针 错误 对 许多 朋友 来 说 都 不 卫生 ， 它 在 许多 编程 语言 中 都 是 极 
为 常见 的 。 以 Java 为 例 。 我 们 有 一 个 String 类 型 的 引用 ，String 
str=null; 。 如 果 它 的 值 为 null， 那 么 接 下 来 用 它 调 用 成 员 函 数 的 时 候 ， 
程序 就 会 抛 出 一 个 NullPointerException。 如 果 不 catch 住 这 个 异常 ， 整 个 
0 据说 ， 这 一 类 问题 已 经 造成 了 业界 无 法 估量 的 巨大 损 








在 2009 年 的 某 次 会 议 中 ， 著 名 的 “快速 排序 ”算法 的 发 明 者 Tony 
I 性 悔 他 曾经 发 明了 “ 空 指针 ”这 个 玩意 儿 。 他 是 这 
羊 说 的 : 


I call it my billion-dollar mistake.It was the invention of the null 
reference in 1965.At that time, I was designing the first comprehensive type 
System for references in an object oriented language (ALGOL W) .My goal 
was to ensure that all use of references should be absolutely safe, with 
checking performed automatically by the compiler.But I couldn’t resist the 
temptation to put in a null reference, simply because it was so easy to 
implement.This has led to innumerable errors, vulnerabilities, and system 
crashes, which have probably caused a billion dollars of pain and damage in 
the last forty years. 


原来 ， 在 程序 语言 中 加 入 空 指针 设计 ， 其 实 并 非 是 经 过 深思 熟 虑 的 
结果， 而 仅仅 是 因为 它 很 容易 实现 而 已 。 这 个 设计 的 影响 是 如 此 深远 ， 
以 全 于 后 来 许多 编程 语言 都 不 假 思索 地 继承 了 这 一 设计 ， 范 围 几 乎 包括 
了 目前 业界 所 有 流行 的 编程 语言 。 


空 指 针 最 大 的 问题 在 于 ， 它 违背 了 类 型 系统 的 初衷 。 我 们 再 来 回忆 
一 下 什么 是 “类 型 "*。 按 维基 百科 的 定义 ， 类 型 是 : 











Type is a classification identifying one of various types of data, that 
determines the possible values for that type, the operations that can be done 
on values of that type, the meaning of the data, and the way values of that 
type can be stored. 


“类 型 ”规定 了 数据 可 能 的 取 值 范围 ， 规 定 了 在 这 些 值 上 可 能 的 操 
作 ， 也 规定 了 这 些 数据 代表 的 含义 ， 还 规定 了 这 些 数据 的 存储 方式 。 


我 们 如 果 有 一 个 类 型 Thing， 它 有 一 个 成 员 函 数 doSomeThing〈) ， 
那么 只 要 是 这 个 类 型 的 变量 ， 就 一 定 应 该 可 以 调用 doSomeThing〈) 函 
数 ， 完 成 同样 的 操作 ， 返 回 同样 类 型 的 返回 值 。 


但 是 ，null 违 背 了 这 样 的 约定 。 一 个 正常 的 指针 和 一 个 null 指 针 ， 哪 
怕 它 们 是 同样 的 类 型 ， 做 同样 的 操作 ， 所 得 到 的 结果 也 是 不 一 样 的 。 那 
么 ， 和 赁 什么 说 null 指 针 和 普通 指针 是 一 个 类 型 呢 ? null 实 际 上 是 在 类 型 系 
统 上 打开 了 一 个 缺口 ， 引 入 一 个 必须 在 运行 期 特殊 处 理 的 特殊 “ 值 >。 它 
就 像 一 个 全 局 的 、 无 类 型 的 singleton 变 量 一 样 ， 可 以 无 处 不 在 ， 可 以 随 
意 与 任意 指针 实现 自动 类 型 转换 。 它 让 编译 器 的 类 型 检查 在 此 处 失去 了 
ss 


那么 ，Rust 里 面 的 解决 方案 是 什么 呢 ? 那 就 是 ， 利 用 类 型 系统 

CADT) 将 空 指针 和 非 空 指针 区 别 开 来 ， 分 别 赋 予 它 们 不 同 的 操作 权 
限 ， 禁 止 针 对 空 指针 执行 解 引用 操作 。 编 译 占 和 静态 检查 工具 不 可 能 知 
道 一 个 变量 在 运行 期 的 “ 值 ”， 但 是 可 以 检查 所 有 变量 所 属 的 “类 型 "*， 来 
判断 它 是 否 符 合 了 类 型 系统 的 各 种 约定 。 如 果 我 们 把 null 从 一 个 “ 值 ”* 上 
升 为 一 个 “类 型 ”， 那 么 静态 检查 就 可 以 发 挥 其 功能 了 。 实 际 上 早 就 已 经 
有 了 这 样 的 设计 ， 叫 作 Option Type， 并 在 scala、haskell、Ocaml、F# 等 
许多 程序 设计 语言 中 存在 了 许多 年 。 


下 面 我 们 以 Rust 为 例 ， 介 绍 一 下 Option 是 如 何 解决 空 指针 问题 的 。 
在 Rust 中 ，Option 实 际 上 只 是 一 个 标准 库 中 普通 的 enum: 





























pub enum Option<T> { 
/// No value 
None, 
/// Some value ‘TT. 
Some(T) 

} 








Rust 中 的 enum 要 求 ， 在 使 用 的 时 候 必 须 “ 完 整 上 匹配 >”。 意 思 是 说 ， 
enum 中 的 每 一 种 可 能 性 都 必须 处 理 ， 不 能 遗漏 。 对 于 一 个 可 空 的 
Option<T> 类 型 ， 我 们 没有 办 法 直接 调用 IT 类 型 的 成 员 函 数 ， 要 么 用 模式 
的 类 型 T 的 内 容 “ 拆 ”出 来 使 用 ， 要 么 调用 Option 类 型 的 成 员 
A 


而 对 于 普通 非 空 类 型 ，Rust 不 允许 赋值 为 None， 也 不 允许 不 初始 化 
了 怠 使 用 。 在 Rust 中 ， 也 没有 null 这 样 的 关键 字 。 另 外 ，Option 类 型 参数 可 
以 是 常见 的 指针 类 型 ， 如 Box 和 && 等 ， 也 可 以 是 非 指针 类 型 ， 它 的 表达 
能 力 其 实 已 经 超过 了 “可 空 的 指针 ”这 一 种 类 型 。 


实际 上 ，C++/C# 等 语言 也 发 现 了 初始 设计 中 的 缺点 ， 并 开发 了 一 
些 补救 措施 。C++ 标 准 库 中 加 入 了 std: : optional<T> 类 型 ，C# 中 加 入 了 
System.Nullable<T> 类 型 。 可 惜 的 是 ， 受 限于 早期 版 本 的 兼容 性 ， 这 些 
设计 己 经 不 能 作为 强制 要 求 使 用 ， 因 此 其 作用 也 就 弱化 了 许多 。 


Option 类 型 有 许多 非常 方便 的 成 员 函 数 可 供 使 用 ， 另 外 我 们 还 可 以 
利用 if-let、while-let 等 语法 糖 。 许 多 情况 下 ， 没 必要 每 次 都 动用 match 语 


句 。 





比如 ，map 方 法 可 以 把 一 个 Option<U> 类 型 转 为 另外 一 个 Option<V> 
 。 


类 





let maybe_some_string = Some(String::from("Hello, World!")); 
lJet maybe_some_len = maybe_some_string.map(|s| s.1len()); 
assert_eq!(maybe_some_len, Some(13)); 





再 比如 ，and_then 方 法 可 以 把 一 系列 操作 串联 起 来 : 





fn sq(x: U32) -> Option<u32> { Some(x * x) } 
fn nope(_: u32) -> Option<u32> { None } 


assert_ eq!(Some(2).and then(sq).and_ then(sq), Some(16)); 





而 unwrap 方 法 则 是 从 Option<T> 中 提取 出 T。 如 果 当 前 状态 是 
None， 那 么 这 个 函数 会 执行 失败 导致 panic。 正 因为 如 此 ， 除 非 是 写 不 
重要 的 小 工具 之 类 的 ， 否 则 这 个 方法 是 不 推荐 使 用 的 。 哪 人 你 很 确定 此 
时 Option 的 状态 一 定 是 Some， 最 好 也 用 expect 方 法 代替 ， 至 少 它 在 发 生 


panic 的 时 候 还 会 打印 出 一 个 字符 串 ， 方 便 我 们 钥 找 原因 。 


这 个 类 型 还 有 许多 有 用 的 方法 ， 各 位 读者 应 该 去 查阅 一 下 标准 库 的 
文档 ， 对 它 的 成 员 方 法 烂熟 于 心 。 


Option 类 型 不 仅 在 表达 能 力 上 非常 优秀 ， 而 且 运 行 开 销 也 非常 小 。 
在 这 里 我 们 还 可 以 再 次 看 到 “和 零 性 能 损失 的 抽象 能力。 示例 如 下 : 














use std::mem::size_of,; 


fn main() { 


println!("size of isize : { 
size_of::<isize>() ); 
println!("size of Option<isize> » 


size_of::<O0ption<isize>>() ); 


printin!("size of &isize : {}", 
size_ of::<&isize>() ); 
println!("size of Box<isize> : {}", 


size_of::<Box<isize>>() ); 


println!("size of Option<&isize> es 
size_of::<0Option<&isize>>() ); 

println!("size of Option<Box<isize>> : {}", 
size_of::<0ption<Box<isize>>>() ); 


println!("size of *const isize J 
size_ of::<* const isize>() ); 

println!("size of Option<*const isize> : {}", 
size_of::<O0ption<*const isize>>() ); 





”这 个 示例 分 析 了 Option 类 型 在 执行 阶段 所 鼎 用 的 内 存 空间 大 小 ， 知 


NA 
. 
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其 中 ， 不 带 Option 的 类 型 大 小 完全 在 意料 之 中 。 
isize&xisizeBox<isize> 这 几 个 类 型 占用 空间 的 大 小 都 等 于 该 系统 平台 上 一 
个 指针 占用 的 空间 大 小 ， 不 足 为 奇 。Option<isize> 类 型 实际 表示 的 含义 


是 “可 能 为 空 的 整数 ”"， 因 此 它 除了 需要 存储 一 个 isize 空 间 的 大 小 之 外 ， 
还 需要 一 个 标记 位 《至 少 lbit) 来 表示 该 值 存在 还 是 不 存在 的 状态 。 这 
里 的 结果 是 16， 猜 测 可 能 是 因为 内 存 对 齐 的 原因 。 


最 让 人 惊奇 的 是 ， 那 两 个 “可 空 的 指针 ?类 型 占用 的 空间 竟然 和 一 个 
站 针 占用 的 空间 相同 ， 并 未 多 浪费 一 点 点 的 空间 来 表示 “指针 是 否 大 
空 ”的 状态 。 这 是 因为 Rust 在 这 里 做 了 一 个 小 优化 : 根据 Rust 的 设计 ， 借 
用 指针 & 和 所 有 权 指 针 Box 从 语义 上 来 说 ， 都 是 不 可 能 为 “0” 的 状态 。 有 
些 数值 是 不 可 能 成 为 这 几 个 指针 指 回 的 地 址 的 ， 它 们 的 取 值 范围 实际 上 
小 于 isize 类 型 的 取 值 范围 。 因 此 Option<&isize> 和 Option<Box<isize>> 类 
型 可 以 利用 这 个 特点 ， 使 用 “0” 值 代表 当前 状态 为 “ 空 ”。 这 意味 着 ， 在 
编译 后 的 机 器 人 码 层面 ， 使 用 Option 类 型 对 指针 的 包装 ， 与 C/C++ 的 指针 
完全 没有 区 别 。 


Rust 是 如 何 做 到 这 一 点 的 呢 ? 在 目前 的 版 本 中 ，Rust 设 计 了 
NonZero 这 样 一 个 struct。 〈 这 个 设计 目前 还 处 于 不 稳定 状态 ， 将 来 很 可 
能 会 有 变化 ， 但 是 基本 思路 应 该 是 不 变 的 。) 























/// A wrapper type for raw pointers and integers that will never be 
/// NULL or 0 that might allow certain optimizations. 

#[lang = "non_zero"] 

#[derive(Copy, Clone, Eq, PartialEq, Ord, PartialOrd, Debug, Hash)] 
pub struct NonZero<T: Zeroable>(T); 





它 有 一 个 attribute#[lang="..."] 表 明 这 个 结构 体 是 Rust 语 言 的 一 部 分 。 
它 是 被 编译 器 特殊 处 理 的 ， 几 是 被 这 个 结构 体 包 起 来 的 类 型 ， 编 译 器 都 
将 其 视 为 “不 可 能 为 0” 的 。 


我 们 再 看 一 下 Box<T> 的 定义 : 








#[lang = "owned_box"] 
#[fundamental] 
pub struct Box<T: ?Sized>(Unique<T>); 





其 中 ，Unique<T> 的 定义 是 : 





pub struct Unique<T: ?Sized> { 
pointer: NonZero<*const T>， 
_marker: PhantomData<T>, 





其 中 PhantomData<T> 是 一 个 零 大 小 的 类 型 pub struct Phantom- 
Data<T: ? Sized>; ， 它 的 作用 是 在 unsafe 编 程 的 时 候 辅 助 编译 器 静态 
检查 ， 在 运行 阶段 无 性 能 开销 ， 此 处 暂时 略 过 。 


把 以 上 代码 综合 起 来 可 以 发 现 ，Option<Box<T>> 的 实际 内 部 表示 
形式 是 Option<NonZero<*const T>>。 因 此 编译 器 就 有 能 力 将 这 个 类 型 的 
占用 空间 压缩 到 与 *const 工 类 型 占用 的 空间 一 致 。 


而 对 于 *const T 类 型 ， 它 本 喘 是 有 可 能 取 值 为 0 的 ， 因 此 这 种 类 型 无 
法 执行 优化 ，Option<*const T> 的 大 小 束 变 成 了 两 个 指针 大 小 。 大 家 搞 
明 自 这 一 点 后 ， 我 们 目 定 义 的 类 型 如 果 也 符合 同样 的 条 件 ， 也 可 以 利用 
这 个 特性 来 完成 优化 。 


总 结 起 来 ， 对 于 Rust 中 的 Option 类 型 ， 读 者 需要 注意 以 下 几 点 。 


1) 如 果 从 你 辑 上 说 ， 我 们 需要 一 个 变量 确实 是 可 空 的 ， 那 么 就 应 
该 显 式 标明 其 类 型 为 Option<T>， 人 否则 应 该 直接 声明 为 T 关 型 。 从 类 型 系 
统 的 角度 来 说 ， 这 二 者 有 本 质 区 别 ， 切 不 可 混为一谈 。 


2) 不 要 轻易 使 用 unwrap 方 法 。 这 个 方法 可 能 会 导致 程序 发 生 
panic。 对 于 小 工具 来 说 无 所 谓 ， 在 正式 项 目 中 ， 最 好 是 使 用 lint 工 具 强 
制 禁止 调用 这 个 方法 。 


3) 相对 于 裸 指针 ， 使 用 Option 包 装 的 指针 类 型 的 执行 效率 不 会 降 
低 ， 这 是 “ 零 开销 抽象 ”。 


4) 不 必 担 心 这 样 的 设计 会 导致 大 量 的 match 语 句 ， 使 得 程序 可 读 性 
变 兰 。 因 为 Option<T> 类 型 有 许多 方便 的 成 员 函 数 ， 再 配合 上 闭 包 功 
能 ， 实 际 上 在 表达 能 力 和 可 读 性 上 要 更 胜 一 筹 。 


























第 9 章 ” 安 
9.1 简介 macro 


“ 宏 ”(macro) 是 Rust 的 一 个 重要 特性 。Rust 的 “ 宏 ”(macro〉 是 一 
种 编译 器 扩展 ， 它 的 调用 方式 为 gome_macro! (...) 。 宏 调用 与 普通 函 
数 调 用 的 区 别 可 以 一 眼 区 分 开 来 ， 几 是 宏 调用 后 面 都 跟着 一 个 感叹 号 。 
宏 也 可 以 通过 some_macro! [...] 和 some _macro! {...} 两 种 语法 调用 ， 只 
要 括 写 能 正确 逻 配 即 可 。 我 们 在 本 书 一 开始 就 已 经 使 用 了 “ 宏 "， 大 家 一 
定 记 得 println! 这 个 宏 ， 它 可 以 用 于 同 标 准 输出 打印 字符 串 。 


与 C/C++ 中 的 宏 不 一 样 的 是 ，Rust 中 的 宏 是 一 种 比较 安全 的 “卫生 
宏 ”(hygiene) 。 首 先 ，Rust 的 宏 在 调用 的 时 候 跟 函 数 有 明显 的 语法 区 
别 ; 其 次 ， 宏 的 内 部 实现 和 外 部 调用 者 处 于 不 同名 字 空 间 ， 它 的 访问 范 
围 严格 受 限 ， 是 通过 参数 传递 进去 的 ， 我 们 不 能 随意 在 宏 内 访问 和 改变 
外 部 的 代码 。C/C++ 中 的 宏 只 在 预 处 理 阶 段 起 作用 ， 因 此 只 能 实现 类 似 
文本 蔡 换 的 功能 。 而 Rust 中 的 宏 在 语法 解析 之 后 起 作用 ， 因 此 可 以 获取 
更 多 的 上 下 文 信息 ， 而 且 更 加 安全 。 


我 们 可 以 把 “ 宏 * 视 为 “元 编程 ”的 一 种 方式 。 它 是 一 种 “生成 程序 的 
程序 ”。 宏 有 很 多 用 处 。 








9.1.1 实现 编译 阶段 检查 


比如 我 们 用 下 面 的 方式 调用 printn! 宏 : 





fn main() { 
println!("number1 {} number2 {}"); 
} 





编译 器 会 产生 一 个 编译 错误 “invalid reference to argument"0`” (no 
arguments given) ”。 这 是 因为 我 们 的 第 一 个 参数 是 一 个 字符 串 模 板 ， 它 
应 该 接受 两 个 参数 用 于 内 部 填充 ， 可 是 我 们 在 调用 的 时 候 ， 后 面 没 有 提 
供 足 够 的 参数 ， 因 此 出 错 。 这 个 功能 如 果 使 用 普通 函数 来 实现 ， 是 不 可 


能 在 编译 阶段 实现 这 样 的 错误 检查 功能 的 。 使 用 宏 ， 我 们 可 以 在 编译 阶 
段 分 析 这 个 字符 串 常量 和 对 应 参数 ， 确 保 它 符 合约 定 。 男 外 一 个 常见 的 
场景 是 ， 利 用 宏 来 检查 正则 表达 式 的 正确 性 。 








9.1.2 ”实现 编译 期 计算 


比如 以 下 代码 可 以 打印 出 当前 源 代码 的 文件 名 ， 以 及 当前 代码 的 行 
数 。 这 些 信息 都 是 纯 编 译 阶段 的 信息 。 








fn main() { 
println!("file {} line {} ", file!(), line!()); 
} 





在 某 些 场景 下 ， 利 用 宏 来 完成 一 些 编译 期 计算 也 是 一 种 可 行 的 选 


择 
9.1.3 ”实现 自动 代码 生成 


有 些 情况 下 ， 许 多 代码 具有 同样 的 “模式 "， 但 是 它们 不 能 用 现 有 的 
语法 工具 ， 如 “函数 ”“ 泛 型 ”trait”* 等 对 其 进行 合理 抽象 。 如 果 这 样 的 
boilerplate 代 码 数 量 很 多 ， 实 际 上 意味 着 代码 违反 了 “Don't Repeat 
Yourself” 原 则 ， 那 么 我 们 可 以 用 “ 宏 ” 来 精简 代码 ， 消 除 重 复 。 


比如 ， 在 标准 库 中 就 有 许多 类 似 的 用 法 。 在 core/ops.rs 代 码 中 ， 内 
置 类 型 对 各 种 运算 符 trait 的 支持 就 使 用 了 安 。 











add_impl! { usize U8 U16 U32 U64 isize i8 i16 i32 i64 f32 f64 } 





这 是 各 个 内 置 类 型 实现 std: : OPpS: : Add 这 个 trait 的 办 法 。 因为 这 
Ra 所 以 可 以 将 它们 提取 到 一 个 “ 宏 ”* 里 面 ， 以 避免 无 聊 的 
重复 。 


9.1.4 ”实现 语法 扩展 


某 些 情况 下 ， 我 们 可 以 使 用 宏 来 设计 比较 方便 的 “语法 糖 >， 而 不 必 
使 用 编译 器 内 部 便 编 码 来 实现 。 比 如 初始 化 一 个 动态 数组 ， 我 们 可 以 使 
用 方便 的 vec! 安 : 








let v = vec![1, 2, 3, 4, 5]; 








简洁 、 直 观 、 明 了 ， 而 且 不 是 编译 占 内 部 的 “ 黑 魔法 ”。 我 们 可 以 充 
分 发 挥 自己 的 想象 力 ， 通 过 上 自 定 义 宏 来 增加 语言 的 表达 能 力 ， 甚 至 自 定 
XDSL (Domain Specific Language) 。 





Sl 


> 


和 目 定义 宏 有 两 种 实现 方式 : 
:通过 标准 库 提供 的 macro_rules! 宏 实现 。 
:通过 提供 编译 器 扩展 来 实现 。 


编译 器 扩展 只 能 在 不 稳定 版 本 中 使 用 。 它 的 API 正 在 重新 设计 中 ， 
还 没有 正式 定稿 ， 这 就 是 所 谓 的 macro 2.0。 在 后 面 ， 我 们 会 体验 macro 
1.1， 它 就 是 macro 2.0 的 缩微 版 。 


下 面 我 们 来 使 用 一 个 例子 讲解 如 何 使 用 macro_rules! 实现 目 定 义 
宏 。macro_rules! 是 标准 库 中 为 我 们 提供 的 一 个 编写 简单 宏 的 小 工具 ， 
它 本 里 也 是 用 编译 器 扩展 来 实现 的 。 它 可 以 提供 一 种 “示范 型 ”(by 
example) 宏 编写 方式 。 


举 个 例子 ， 我 们 考虑 一 下 这 样 的 需求 : 提供 一 个 hashmap! 宏 ， 实 
现 如 下 初始 化 HashMap 的 功能 : 








let counts = hashmap!['A' => 0, 'C' => 0，'G' => 0, 'T' => 0]; 





首先 ， 定 义 hashmap 这 样 一 个 宏 名 字 : 





macro_rules! hashmap { 





在 大 括号 里 面 ， 我 们 定义 宏 的 使 用 语法 ， 以 及 它 展开 后 的 形态 。 定 
义 方式 类 似 match 语 句 的 语法 ，expander=>f{transcriber}。 左 边 的 是 宏 扩 
展 的 语法 定义 ， 后 面 是 宏 扩 展 的 转换 机 制 。 语 法 定义 的 标识 符 以 $ 开 
头 ， 类 型 支持 item、block、stmt、pat、expr、ty、itent、path、tt。 我 们 
的 需求 是 需要 一 个 表达 式 ， 一 个 “=>” 标 识 符 ， 再 跟 一 个 表达 式 ， 因 此 ， 
宏 可 以 写成 这 样 : 








macro_rules! hashmap { 


($key: expr => $val: expr) => { 
// 暂时 空 着 
() 
} 
} 





现在 我 们 已 经 实现 了 一 个 hashmap! {'A'=>'1'}; 这 样 的 语法 了 。 我 
们 希望 这 个 宏 扩 展开 后 的 类 型 是 HashMap， 而 且 进 行 了 合理 的 初始 化 ， 
那么 我 们 可 以 使 用 “语句 块 * 的 方式 来 实现 : 





macro_rules! hashmap { 
($key: expr => $val: expr) => { 


let mut map = ::std::collections::HashMap::new(); 
map.insert($key, $val); 

map 

} 


} 
} 





现在 我 们 和 希望 在 宏 里 面 ， 可 以 文 持 重 复 多 个 这 样 的 语法 元 隶 。 我 们 
可 以 使 用 + 模式 和 * 模 式 来 完成 。 类 似 正则 表达 式 的 概念 ，+ 代 表 一 个 或 
者 多 个 重复 ，* 代 表 零 个 或 者 多 个 重复 。 因 此 ， 我 们 需要 把 需要 重复 的 
部 分 用 括号 括 起 来 ， 并 加 上 去 号 分 隔 符 : 











macro_rules! hashmap { 
($( $key: expr => $val: expr ),*) => {{ 


let mut map = ::std::collections::HashMap::new(); 
map.insert($key, $val); 
map 


}} 
} 





最 后 ， 我 们 在 语法 扩展 的 部 分 也 使 用 * 符 号 ， 将 输入 部 分 扩展 为 多 
条 insert 语 句 。 最 终 的 结果 如 下 所 示 : 





macro_rules! hashmap { 
($( $key: expr => $val: expr ),*) => {{ 


let mut map = ::std::collections::HashMap::new(); 
$( map.insert($key, $val); )* 
map 


}} 
} 


fn main() { 
let counts = hashmap!['A' => 0, 'C' => 0, 'G' => 0, 'T' => 0]; 


println!("{:?}", counts); 








-个 目 定 义 宏 束 诞生 了 。 如 果 我 们 想 检 查 一 下 宏 展 开 的 情况 是 否 正 
确 ， 可 以 使 用 如 下 rustc 的 内 部 命令 : 





rustc -Z unstable-options --pretty=expanded temp.rs 





可 以 看 到 ，hashmap! 宏 展 开 后 的 结果 是 : 





Jet counts = 


let mut map ::Std::collections::HashMap: :new( ); 


map.insert('A', 0); 
map.insert('C', 0); 
map.insert('G', 0); 
map.insert('T', 0); 


map 


}; 











很 大 一 部 分 宏 的 需求 我 们 都 可 以 通过 这 种 方式 实现 ， 它 比较 适合 写 
那 种 一 个 模子 套 出 来 的 重复 代码 。 








9.3 ” 宏 1.1 


对 于 一 些 简单 的 宏 ， 这 种 “示例 型 ”(by example) 的 方式 足够 使 用 
了 。 但 是 更 复杂 的 逻辑 则 需要 通过 更 复杂 的 方式 来 实现 ， 这 了 束 是 所 谓 
的 “过 程 宏 ”(procedural macro) 。 它 是 直接 用 Rust 语 言 写 出 来 的 ， 相 当 
于 一 个 编译 吉 插 件 。 但 是 编译 器 插件 的 最 大 问题 是 ， 它 依赖 于 编译 器 的 
内 部 实现 方式 。 一 旦 编译 器 内 部 有 所 变化 ， 那 么 对 应 的 宏 束 有 可 能 出 现 
编译 错误 ， 需 要 修改 。 因 此 ，Rust 中 的 “ 宏 ” 一 直 难 以 稳定 。 


所 以 ，Rust 设 计 者 希望 提供 一 套 相 对 稳定 一 点 的 API， 它 基本 跟 
rustc 的 内 部 数据 结构 解 厢 。 这 个 设计 就 是 macro 2.0。 这 个 功能 目前 暂时 
还 没完 成 。 但 是 ，Rust 提 前 推出 了 一 个 macro 1.1 版 本 。 我 们 在 1.15 正 式 
版 中 可 以 体验 一 下 这 个 功能 的 概貌 。 所 谓 的 macro 1.1 是 按照 2.0 的 思路 
专门 为 自动 derive 功 能 设计 的 ， 是 一 个 缩微 版 的 macro 2.0。 


在 Rust 中 ，attribute 也 是 一 种 特殊 的 宏 。 在 编译 器 内 部 ，attribute 和 
macro 并 没有 本 质 的 区 别 ， 它 们 都 是 所 谓 的 编译 器 扩展 。 在 以 后 的 macro 
2.0 中 ， 我 们 也 可 以 用 类 似 的 API 设 计 自 定 义 attribute。 目 前 有 一 个 叫 作 
derive 的 attribute 是 最 常用 的 ， 最 需要 支持 自 定义 扩展 。 专 门 为 文 持 自 定 
义 derive 的 功能 ， 就 是 macro 1.1。derive 功 能 我 们 在 trait 一 章 中 己 经 讲 过 
了 ，attribute 可 以 让 编译 器 帮 我 们 自动 impl 某 些 trait。 


目前 ， 编 译 器 的 derive 只 支持 一 小 部 分 固定 的 trait。 但 我 们 可 以 通过 
日 定义 宏 实 现 扩 展 derive。 下 面 ， 我 们 用 一 个 示例 来 演示 一 下 如 何 使 用 
macro 1.1 完 成 自 定 义 #[derive (HelloWorld)] 功 能 。 


首先 ， 需 要 把 编译 工具 升级 到 最 新 的 nightly 版 本 。 然 后 创建 两 个 项 
目 : 一 个 是 实现 宏 ， 一 个 使 用 宏 。 




















$ cargo new --bin hello-world 
$ cd hello-world 
$ cargo new hello-world-derive 





在 hello-world-derive 项 目的 Cargo.toml 中 ， 加 上 项 目 属 性 设置 : 








[1ib] 


proc-macro=true 





在 hello-world 项 目的 Cargo.toml 中 ， 设 置 项 目 依赖 : 





[dependencies] 
hello-world-derive = { path = "hello-world-derive" } 








宏 项 目 编译 完成 后 ， 会 生成 一 个 动态 链接 库 。 这 个 库 会 被 编译 器 在 
编译 主 项 目的 过 程 中 调用 。 在 主 项 目 代 码 中 写 上 如 下 测试 代码 : 





#[macro_usel] 
extern crate hello_world_derive; 


trait THelloworld { 
fn hello(); 


#[derive(Hellowor]ld)] 
struct FrenchToast; 


fn main() { 
FrenchToast: :hello(); 
} 








接 下 来 ， 我 们 来 实现 这 个 宏 。 它 的 代码 骨架 如 下 所 示 : 





extern crate proc_macro,; 


use proc_macro: :Tokenstream,; 
use std::str::Fromstr; 


#[proc_macro_derive(Helloworl1d)] 

pub fn hello world(input: TokenStream) -> TokenStream { 
// Construct a string representation of the type definition 
let s = input.to_string(); 


TokenStream: :from_str("").unwrap() 





我 们 的 主要 逻辑 就 写 在 hello_world 函 数 中 ， 它 需要 用 
proc_macro_derive 修 饰 。 它 的 签名 是 ， 输 入 一 个 TokenStream， 输 出 一 个 
TokenStream。 这 个 TokenStream 类 型 目前 还 没 实现 什么 有 用 的 成 员 方 
法 ， 和 暂时 只 提供 了 和 字符 串 类 型 之 间 的 转换 方式 。 我 们 在 函数 中 把 input 


的 值 打印 出 来 : 





let s = input.to_string(); 
println!("{}", s); 





编译 可 见 ， 输 出 值 为 struct FrenchToast; 。 由 此 可 见 ， 编 译 器 将 # 
[derive〈) ] 安 修饰 的 部 分 作为 参数 ， 传 递 给 了 我 们 这 个 编译 器 扩展 函 
数 。 我 们 需要 对 这 个 参数 进行 分 析 ， 然 后 将 希望 自动 生成 的 代码 作为 返 
回 值 传递 出 去 。 


在 这 里 ， 我 们 引入 regex 库 来 辅助 实现 逻辑 。 在 项 目 文件 中 ， 加 入 
以 下 代码 : 





[dependencies] 
regex = "0.2" 





然后 写 一 个 函数 ， 把 类 型 名 字 从 输入 参数 中 提取 出 来 : 





fn parse_struct_name(s: &str) -> String { 
let r = Regex::new(r"(?:struct\s+)([\Ww\d_]+)").unwrap(); 
let caps = r.captures(s).unwrap(); 
caps[1].to_string() 


#[test] 

fn test_parse_struct_ name() { 
let input = "Struct Foo(i32);"; 
let name = parse_struct_name(input); 
assert_eq!(&name, "Foo"); 





} 





接 下 来 ， 就 可 以 目 动 生成 我 们 的 impl 代 码 了 : 





#[proc_macro_derive(Helloworl1d)] 
pub fn hello world(input: TokenStream) -> TokenStream { 
let s = input.to_string(); 
let name = parse_struct_name(&s); 
let output = format!(r#" 
impl THelloworld for {0} {{ 
fn hello() {{ println!(" {0} says hello "); }} 
}}"#, name); 


TokenStream: :from_str(&output).unwrap() 





我 们 构造 了 一 个 字符 串 ， 然 后 将 这 个 字符 串 转 化 为 TokenStream 类 
型 返回 。 


编译 主 项 目 可 见 ，FrenchToast 类 型 已 经 有 了 一 个 hello() 方法 ， 执 
行 结 果 为 : 





FrenchToast says hello 





在 macro 1.1 版 本 中 ， 只 提供 了 这 么 一 点 简单 的 API。 在 接 下 来 的 
macro 2.0 版 本 中 ， 会 为 TokenStream 添 加 一 些 更 有 用 的 方法 ， 或 许 那 时 
候 惑 没 必 要 把 TokenStream 转 成 字符 串 再 上 自己 解析 一 表 了 。 


第 二 部 分 ”内存 安全 


不 带 自动 内 存 回 收 〈Garbage Collection ) 的 内 存 安 全 是 Rust 语 言 最 


重要 的 创新 ， 是 它 与 其 他 语言 最 主要 的 区 别 所 在 ， 是 Rust 语 言 设计 的 核 
心 Mo 





Rust 希 望 通 过 语言 的 机 制 和 编译 费 的 功能 ， 把 程序 员 易 犯错 、 不 易 
检查 的 问题 解决 在 编 详 期， 避免 运行 时 的 内 存 错误 。 这 一 部 分 主要 探讨 
Rust 是 如 何 达 到 内 存 安全 特性 的 。 





Languages shape the way we think, or don't. 





Erik Naggum 


第 10 章 ”和 内存 管理 基础 
本 章 主要 介绍 没有 垃圾 回收 机 制 下 的 内 存 管理 基础 知识 。 





10.1 ” 堆 和 栈 


一 个 进程 在 执行 的 时 候 ， 它 所 占用 的 内 存 的 虚拟 地 址 空间 一 般 被 分 
割 成 好 几 个 区 域 ， 我 们 称 为 " 段 ” Segment) 。 常 见 的 几 个 段 如 下 。 


代码 段 。 编 译 后 的 机 器 人 码 存 在 的 区 域 。 一 般 这 个 段 是 只 读 的 。 
bss 段 。 存 放 未 初始 化 的 全 局 变量 和 静态 变量 的 区 域 。 
“数据 段 。 存 放 有 初始 化 的 全 局 变量 和 静态 变量 的 区 域 。 


.函数 调用 栈 (call stack segment) 。 存 放 孙 数 参数 、 局 部 变量 以 及 
其 他 函数 调用 相关 信息 的 区 域 。 


- 堆 (heap) 。 存 放 动 态 分 配 内 存 的 区 域 。 


函数 调用 栈 《〈call stack) 也 可 以 简称 为 栈 〈stack) 。 因 为 函数 调用 
栈 本 来 就 是 基于 栈 这 样 一 个 数据 结构 实现 的 。 它 具备 “后 入 先 
出 ”(LIFO) 的 特点 。 最 先进 入 的 数据 也 是 最 后 出 来 的 数据 。 一 般 来 
说 ，CPU 有 专门 的 指令 可 以 用 于 入 栈 或 者 出 栈 的 操作 。 当 一 个 函数 被 调 
用 时 ， 就 会 有 指令 把 当前 指令 的 地 址 压 入 栈 内 保存 起 来 ， 然 后 跳 转 到 被 
调用 的 函数 中 执行 。 函 数 返 回 的 时 候 ， 就 会 把 栈 里 面 先 前 的 指令 地 址 弹 
出 来 继续 执行 ， 如 图 10-1 所 示 。 


堆 是 为 动态 分 配 预 留 的 内 存 空间 ， 如 图 10-2 所 示 。 和 栈 不 一 样 ， 从 
堆 上 分 配 和 重新 分 配 块 没有 固定 模式 ， 用 户 可 以 在 任何 时 候 分 配 和 释放 
它 。 这 样 就 使 得 跟踪 哪 部 分 堆 已 经 被 分 配 和 被 释放 变 得 异常 复杂 ; 有 许 
多 定制 的 堆 分 配 策略 用 来 为 不 同 的 使 用 模式 下 调整 堆 的 性 能 。 堆 是 在 内 
存 中 动态 分 配 的 内 存 ， 是 无 序 的 。 每 个 线程 都 有 一 个 栈 ， 但 是 每 一 个 应 
i 
或 的 问题 。 











sp 








sp: stack pointer (data) 
used: unavailable stack 
args: function areuments 
ret: return address (code) 
locals: local variables 


free: available stack 


free blocks blocks In use 


图 。10-2 4 


一 般 来 说 ， 操 作 系统 提 供 了 在 堆 上 分 配 和 释放 内 存 的 系统 调用 ， 但 
是 用 户 不 是 直接 使 用 这 个 系统 调用 ， 而 是 使 用 封装 的 更 好 的 “内 存 分 配 
器 ”(Allocator) 。 比 如 ， 在 C 语 言 里 面 ， 运 行 时 (runtime〉 束 提供 了 
malloc 和 free 这 两 个 函数 可 以 管理 推 内 存 。 

堆 和 栈 之 间 的 区 别 有 : 

: 栈 上 保存 的 局 部 变量 在 退出 当前 作用 域 的 时 候 会 自动 释放 ; 

: 堆 上 分 配 的 空间 没有 作用 域 ， 需 要 手动 释放 ; 


一 般 栈 上 分 配 的 空间 大 小 是 编译 阶段 就 可 以 确定 的 (CC 语言 里 面 的 
VLA 除 外 ); 


. 栈 有 一 个 确定 的 最 大 长 度 ， 超 过 了 这 个 长 度 会 产生 “ 栈 浇 


出 ”(stack overflow) ; 


堆 的 空间 一 般 要 更 大 一 些 ， 堆 上 的 内 存 耗 尽 了 ， 束 会 产生 “内 存 分 
配 不 足 ”(out of memory) 。 











[1] 此 图 源 于 https://stackoverfl ow.com/questions/79923/what-and-where- 
are-the-stack-and-heap。 
[2] 此 图 源 于 https://stackoverfl ow.com/gquestions/79923/what-and-where- 
are-the-stack-and-heap。 


10.2 ”上段 错误 
我 们 再 回忆 一 下 Rust 的 主要 特点 。Rust 官 方 网 站 给 自己 的 介绍 是 


Rust is a systems programming language that runs blazingly fast, 
prevents segfaults, and guarantees thread safety. 


本 节 束 来 讲 一 下 什么 是 segfault， 以 及 什么 是 Rust 所 谈论 的 “内 存 安 
全 ”概念 。 


segfault 实 际 上 是 “segmentation fault” 的 缩写 形式 ， 我 们 可 以 翻译 
为 " 段 错误 ”。segfault 是 这 样 形 成 的 : 进程 空间 中 的 每 个 段 通过 硬件 
MMU 了 映射 到 真正 的 物理 空间 ; 在 这 个 映射 过 程 中 ， 我 们 还 可 以 给 不 同 
的 段 设置 不 同 的 访问 权限 ， 比 如 代码 段 就 是 只 能 读 不 能 写 ; 进程 在 执行 
过 程 中 ， 如 果 违 反 了 这 些 权 限 ，CPU 会 直接 产生 一 个 硬件 异常 ， 硬 件 异 
常会 被 操作 系统 内 核 处 理 ， 一 般 内 核 会 同 对 应 的 进程 发 送 一 条 信号 ; 如 
果 没 有 实现 自己 特殊 的 信号 处 理 函 数 ， 默 认 情 况 下 ， 这 个 进程 会 直接 非 
正常 退出 ， 如 果 操 作 系统 打开 了 core dump 功 能 ， 在 进程 退出 的 时 候 操 
作 系 统 会 把 它 当 时 的 内 存 状态 、 寄 存 器 状态 以 及 各 种 相关 信息 保存 到 一 
个 文件 中 ， 供 用 户 以 后 调试 使 用 。 


在 传统 系统 级 编程 语言 C/C++ 里 面 ， 制 造 segfault 是 很 容易 的 。 程 序 
员 需 要 非常 小 心 才能 避免 这 种 错误 ， 这 也 是 为 什么 会 有 那么 多 的 代码 标 
; 准 来 规范 程序 员 的 行为 。 而 另外 一 类 编程 语言 规避 segfault 的 办 法 是 使 用 
自动 垃圾 回收 机 制 。 在 这 些 编程 语言 中 ， 指 针 的 能 力 被 大 幅 限 制 ， 内 存 
分 配 和 释放 都 在 一 个 运行 时 环境 中 被 严格 管理 。 当 然 ， 这 么 做 也 付出 了 
一 定 的 代价 。 某 些 应 用 场景 下 用 这 样 的 代价 换取 开发 效率 和 安全 性 是 非 
常 划算 的 ， 而 在 某 些 应 用 场景 下 这 样 的 代价 是 不 可 接受 的 。 


Rust 的 主要 设计 目标 之 一 ， 是 在 不 用 自动 垃圾 回收 机 制 的 前 提 下 避 
免 产 生 segfault。 从 这 个 意义 上 来 说 ， 它 是 独一无二 的 。 人 至 于 它 是 如 何 做 
到 的 ， 本 书 将 会 详细 训 析 。 











1 内 人 全 全 


在 谈 到 Rust 的 时 候 ， 经 常会 提 到 的 一 个 概念 ， 那 就 是 “内 存 安 
全 ”(Memory safety) 。 内 存 安 全 是 Rust 设 计 的 主要 目标 之 一 ， 因 此 我 
们 有 必要 把 这 个 概念 做 一 个 浴 清 ， 让 大 家 能 更 清楚 地 理解 Rust 为 什么 要 
这 么 设计 。 











在 Wikipedia 上， 内 存 安全 是 这 么 定义 的 : 


Memory safety is the state of being protected from various software 
bugs and security vulnerabilities when dealing with memory access, such as 
buffer overflows and dangling pointers. 


下 面 列举 一 系列 的 “内 存 不 安全 ”的 例子 。 以 下 这 些 情 况 ， 就 是 Rust 
想 要 避免 的 问题 。 


空 指针 


解 引 用 空 指针 是 不 安全 的 。 这 块 地 址 空间 一 般 是 受 保护 的 ， 对 空 指 
针 解 引用 在 大 部 分 平台 上 会 产生 segfault。 


时 指针 


时 指针 指 的 是 未 初始 化 的 指针 。 它 的 值 取 决 于 它 这 个 位 置 以 前 遗留 
下 来 的 是 什么 值 。 所 以 它 可 能 指向 任意 一 个 地 方 。 对 它 解 引用 ， 可 能 会 
造成 segfault， 也 可 能 不 会 ， 纯 粹 赁 运气 。 但 无 论 如 何 ， 这 个 行为 都 不 会 
是 你 预期 内 的 行为 ， 是 一 定 会 产生 bug 的 。 














悬空 指针 指 的 是 内 存 空 间 在 被 释放 了 之 后 ， 继 续 使 用 。 它 跟 野 指针 
类 似 ， 同 样 会 读 写 已经 不 属于 这 个 指针 的 内 容 。 


使 用 未 初始 化 内 存 


不 只 是 指针 类 型 ， 任 何 一 种 类 型 不 初始 化 就 直接 使 用 都 是 危险 的 ， 
造成 的 后 果 我 们 完全 无 法 预测 。 





非法 释放 


内 存 分 配 和 释放 要 配对 。 如 果 对 同一 个 指针 释放 两 次 ， 会 制造 出 内 
对 其 执行 释放 操作 ， 也 
是 危险 的 。 


-缓冲 区 溢出 


旨 针 访问 越界 了， 结果 也 是 类 似 于 时 指针， 会 读 取 或 者 修改 临近 内 
存 空间 的 值 ， 造 成 危险 。 


-执行 非法 函数 指针 


如 琳 一 个 函数 指针 不 是 准确 地 指 癌 一 个 函数 地 址 ， 那 么 调用 这 个 函 
数 指针 会 叶 致 一 段 随 机 数据 被 当成 指令 来 执行 ， 古 非常 危险 的 。 


数据 苋 争 
在 有 并 发 的 场景 下 ， 针 对 同一 块 内 存 同时 读 写 ， 且 没有 同步 措施 。 


以 上 这 些 问 题 都 是 极度 和 危险 的 ， 而 且 它 们 并 不 一 定 会 在 发 生 的 时 候 
就 被 发 现 并 立即 终止 。 它 们 不 一 定 会 直接 触发 core dump， 有 可 能 程序 
一 直 带 病 运 行 ， 只 是 结果 一 直 有 bug 但 却 无 法 找到 原因 ， 因 为 真正 的 原 
因 与 表现 之 间 没 有 任何 肉眼 可 见 的 关联 关系 。 它 们 有 可 能 造成 非常 随机 
的 、 难 以 复 现 和 难以 调试 的 诡异 bug， 就 像 武 林 高 手 一 样 神出鬼没 ， 行 
踩 不 定 。 它 们 也 可 能 在 经 过 许多 步骤 之 后 最 终 触 发 core dump， 可 惜 此 
时 早已 不 是 案 发 第 一 现场 ， 修 复 这 种 bug 的 难度 极 高 。 


在 Rust 语 境 中 ， 还 有 一 些 内 存 错误 是 不 算 在 “内 存 安全 ”范畴 内 的 ， 
比如 内 存 汇 漏 以 及 内 存 耗 尽 。 内 存 泄漏 显然 是 一 种 bug， 但 古 它 不 会 直 
接 造 成 非常 严重 的 后 果 ， 人 至 少 比 上 面 列 出 的 那些 错误 危险 性 要 低 一 些 ， 
解决 的 办 法 也 是 完全 不 一 样 的 。 同 样 ， 内 存 耗 尽 也 不 是 事 关 安全 性 的 问 
题 ， 出 现 内 存 耗 尽 的 时 候 ，Rnust 程 序 的 行为 依然 是 确定 性 的 和 可 控 的 
(目前 版 本 下 ， 如 果 内 存 耗 尽 则 发 生 panic， 也 有 人 认为 在 这 种 情况 发 生 
J 应 该 给 个 机 会 由 用 户 自己 处 理 ， 这 种 情况 后 面 应 该 会 有 改 
Es 


另外 ，panic 也 不 属于 内 存 安 全 相关 的 问题 。 在 后 面 我 们 会 伦 很 多 篇 









































幅 来 讲解 panic。panic 和 core dump 之 间 有 重要 区 别 。panic 是 发 生 不 可 恢 
复 错误 后 ， 程 序 主动 执行 的 一 种 错误 处 理 机 制 ， 而 core dump 则 是 程序 
失控 之 后 ， 触 发 了 操作 系统 的 保护 机 制 而 被 动 退出 的 。 发 生 panic 的 时 
候 ， 此 处 就 是 确定 性 的 第 一 现场 ， 我 们 可 以 根据 call stack 信 息 很 快 找到 
事 发 地 点 ， 然 后 修复 。panic 是 防止 更 严重 内 存 安全 错误 的 重要 机 制 。 


第 11 章 ”所 有 权 和 移动 语义 
11.1 什么 是 所 有 权 


拿 C 语 言 的 代码 来 打 个 比方 。 我 们 可 能 会 在 堆 上 创建 一 个 对 象 ， 然 
后 使 用 一 个 指针 来 管理 这 个 对 象 : 


Foo *p = make_object("args"); 


接 下 来 ， 我 们 可 能 需要 使 用 这 个 对 象 : 





use_object(p); 








然而 ， 这 段 代码 之 后 ， 谁 能 猜 得 到 ， 指 针 p 指 向 的 对 象 究竟 发 生 了 
什么 ? 它 是 否 被 修改 过 了 ? 它 还 存在 吗 ， 是 否 已 经 被 释放 ? 是 否 有 另外 
一 个 指针 现在 也 同时 指向 这 个 对 象 ? 我 们 还 能 继续 读 取 、 修 改 或 者 释放 
这 个 对 象 吗 ? 实际 上 ， 除 了 去 了 解 use_object 的 内 部 实现 之 外 ， 我 们 没 
办 法 回答 以 上 问题 。 

对 此 ，C++ 进 行 了 一 个 改进 ， 即 通过 “智能 指针 ”来 描述 “所 有 
权 ”(Ownership〉 概 仿 。 这 在 一 定 程度 上 减少 了 内 存 使 用 bug， 实 现 
了 “半自动 化 ”的 内 存 管 理 。 而 Rust 在 此 基础 上 更 进一步 ， 将 “所 有 权 ” 的 
理念 直接 融入 到 了 语言 之 中 。 

“< 所有权” 代表 着 以 下 意义 : 


-每 个 值 在 Rust 中 都 有 一 个 变量 来 管理 它 ， 这 个 变量 就 是 这 个 值 、 这 
块 内 存 的 所 有 者 ; 


-每 个 值 在 一 个 时 间 点 上 只 有 一 个 管理 者 ; 
当 变 量 所 在 的 作用 域 结束 的 时 候 ， 变 量 以 及 它 代 表 的 值 将 会 被 销 




















毁 。 


拿 前 面 已 经 讲 过 的 字符 串 String 类 型 来 举例 : 





fn main() { 
let mut s = String::from("hello"); 
s.push_str(" world"); 
println!i("{}", s); 

} 





当 我 们 声明 一 个 变量 s， 并 用 String 类 型 对 它 进行 初始 化 的 时 候 ， 这 
个 变量 s 就 成 了 这 个 字符 串 的 “所 有 者 ”。 如 果 我 们 希望 修改 这 个 变量 ， 
可 以 使 用 mut 修 饰 s， 然 后 调用 String 类 型 的 成 员 方 法 来 实现 。 当 main 函 
数 结 束 的 时 候 ，s 将 会 被 析 构 ， 它 管理 的 内 存 (不论 是 堆 上 的 ， 还 是 栈 
上 的 ) 则 会 被 释放 。 

我 们 一 般 把 变量 从 出 生 到 死亡 的 整个 阶段 ， 叫 作 一 个 变量 的 “生命 
周期 >”。 比 如 这 个 例子 中 的 局 部 变量 s， 它 的 生命 周期 束 是 从 let 语 句 开 
始 ， 到 main 函 数 结 


在 上 述 示例 的 基础 上 ， 知 做 一 点 修改 : 




















fn main() { 
let s = String::from("hello"); 
let si = s; 
println!i("{}", s); 

} 





编译 ， 可 见 : 





error[E0382]: use of moved value: ‘s. 
--> test.rs:5:20 
| 
4 | let si = s; 
| -- Value moved here 
5 | println!("{}", Ss); 
| 人 ^ Value used here after move 
| 


note: move occurs because `S has type ‘std::string::String’, which does not imr 








这 里 出 现 了 编译 错误 。 编 译 嚣 显示， 在 let sl1=s; 语句 中 ， 原 本 由 s 
Ds 己 经 转移 给 了 sl 这 个 变量 。 所 以 ， 后 面 继 续 使 用 s 是 不 对 
条 





也 就 是 前 面 所 说 的 每 个 值 只 有 一 个 所 有 者 。 变 量 s 的 生命 周期 从 声 
明 开 始 ， 到 move 给 sl 就 结束 了 。 变 量 s1 的 生命 周期 则 是 从 它 声明 开始 ， 
到 函数 结束 。 而 字符 串 本 身 ， 由 String: : fom 函 数 创建 出 来 ， 到 函数 
结束 的 时 候 就 会 销毁 。 中 间 所 有 权 的 转换 ， 并 不 会 将 这 个 字符 串 本 身 重 
新 销 股 再 创建 。 在 任意 时 刻 ， 这 个 字符 串 只 有 一 个 所 有 者 ， 要 么 是 s， 


要 么 是 s1。 





请 注意 ，Rust 的 赋值 和 C++ 的 赋值 有 重大 区 别 。 如 采 我 们 用 C++ 来 
实现 上 面 这 个 例子 的 话 ， 程 序 如 下 : 





#include <iostream> 
using namespace std; 


int main() { 
string s("hello"); 
string S1 = s,; 
cout << s << endl,; 
cout << S1 << endl; 
return ©; 





在 用 变量 s 初 始 化 s1 的 时 候 ， 并 不 会 造成 sg 的 生命 周期 结束 。 这 里 只 
会 调用 string 类 型 的 复制 构造 函数 复制 出 一 个 新 的 字符 串 ， 于 是 在 后 面 s1 
和 s$ 都 是 合法 变量 。 在 Rust 中 ， 我 们 要 模拟 这 一 行为 ， 需 要 手动 调用 
clone 〈) 方法 来 完成 : 





fn main() { 
let s = String::from("hello"); 
let si = s.clone(); 
println!("{} {}", s, s1); 

} 





在 Rust 里 面 ， 不 可 以 做 “赋值 运算 符 重 载 ?， 知 需要 “ 深 复 制 ”， 必 须 
手工 调用 clone 方 法 。 这 个 cdlone 方 法 来 自 于 std: : clone: : Clone 这 个 
trait。clone 方 法 里 面 的 行为 是 可 以 目 定义 的 。 





11.2 移动 语义 
一 个 变量 可 以 把 它 拥有 的 值 转移 给 另外 一 个 变量 ， 称 为 “所有权 转 
移 "。 赋 值 语句 、 函 数 调 用 、 函 数 返 回 等 ， 都 有 可 能 导致 所 有 权 转 移 。 
比如 : 


fn create() -> String { 
let s = String::from("hel 


0"); 
return s; // 所 有 权 和 转移， 必 二 史册 条 吉 二 所 各 

















} 


fn consume(s: String) { // 所 有 权 转 移 , 从 函数 外 部 移动 到 内 部 
println!("{}", s); 
} 


fn main() { 
let s = create(); 
consume(s); 

















在 上 面 这 个 例子 中 ， 尔 数 参 数 、 函 数 返 回 都 发 生 了 所 有 权 转 移 ， 转 
移 的 过 程 可 以 用 图 11-1 表 示 。 


所 有 权 转 移 的 步骤 分 解 如 下 。 
1) main 函 数 调 用 create 函 数 。 


2) 在 调用 create 函 数 的 时 候 创建 了 字符 串 ， 在 栈 上 和 堆 上 都 分 配 有 
内 存 。 局 部 变量 s 是 这 些 内 存 的 所 有 者 。 


3) create 图 数 返回 的 时 候 ， 需 要 将 局 部 变量 s 移 动 到 函数 外 面 ， 这 
过 程 就 是 简单 地 按 字 节 复 制 memcpy。 
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a) 子 数 返回 所 有 权 转 移 
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b) 因数 参数 所 有 权 转 移 
图 11-1 


4) 同 理 ， 在 调用 consume 函 数 的 时 候 ， 需 要 将 main 函 数 中 的 局 部 变 
量 转移 到 consume 函 数 ， 这 个 过 程 也 是 简单 地 按 字 节 复制 memcpy。 


5) 当 consume 函 数 结束 的 时 候 ， 它 并 没有 把 内 部 的 局 部 变量 再 转移 
出 来 ， 这 种 情况 下 ，consume 内 部 局 部 变量 的 生命 周期 就 该 结束 了 。 这 
个 局 部 变量 s 生 命 周 期 结束 的 时 候 ， 会 自动 释放 它 所 拥有 的 内 存 ， 因 此 
字符 串 也 就 被 释放 了 。 





Rust 中 所 有 权 转 移 的 重要 特点 是 ， 它 是 所 有 类 型 的 默认 语义 。 这 是 
许多 读者 一 开始 不 习惯 的 地 方 。 这 里 再 重复 一 这， 请 大 家 牢 牢 记 住 ， 
Rust 中 的 变量 绑 定 操作 ， 默 认 是 move 语 义 ， 执 行 了 新 的 变量 绑 定 后 ， 原 
来 的 变量 束 不 能 再 被 使 用 ! 一 定 要 记 住 ! 


Rust 的 这 一 规定 非常 有 利于 编译 器 静态 检查 。 与 之 相对 的 ，C++ 的 
做 法 就 不 一 样 了 ， 它 允许 赋值 构造 图 数 、 赋 值 运算 符 重 载 ， 因 此 在 出 
现 “ 构 造 ?或 者 “赋值 ?操作 的 时 候 ， 有 可 能 表达 的 是 完全 不 同 的 含义 ， 这 
取决 于 程序 员 如 何 实现 重 载 。C++ 的 这 个 设计 具有 巨大 的 灵活 性 ， 但 是 
不 恰当 的 实现 也 可 能 造成 内 存 不 安全 。 而 Rust 的 这 一 设计 大 幅 降 低 了 语 
言 的 复杂 度 , “移动 语义 ”不 可 能 执行 用 户 的 自 定 义 代 码 ， 没 有 任何 内 存 
安全 风险 ， 而 且 满 足 异 常安 全 。 在 C++ 里 面 ，std: : 
vector<int>v1=v2; 是 复制 语义 ， 而 Rust 里 面 的 let V1: Vec<i32>=v2; 是 
移动 语义 。 如 果 要 在 Rust 里 面 实现 复制 语义 ， 需 要 显 式 写 出 函数 调用 ]let 
V1: Vec<i32>=v2.clone () ; 。 如 果 我 们 在 C++ 中 实现 移动 语义 ， 则 需 
要 用 户 自 定义 实现 移动 构造 函数 及 移动 赋值 运算 符 。 











对 于 “移动 语义 ”， 最 后 还 需要 强调 的 一 点 是 ,，“ 语 义 ” 不 代表 最 终 的 
执行 效率 。“ 语 义 ” 只 是 规定 了 什么 样 的 代码 是 编译 器 可 以 接受 的 ， 以 及 
它 执行 后 的 效果 可 以 用 怎样 的 思维 模型 去 理解 。 编 译 器 有 权 在 不 改变 语 
义 的 情况 下 做 任何 有 利于 执行 效率 的 优化 。 语 义 和 优 化 是 两 个 阶段 的 事 
情 。 我 们 可 以 把 移动 语义 想象 成 执行 了 一 个 memcpy， 但 真实 的 汇编 代 
码 未 必 如 此 。 比 如 : 








fn create() -> Bigobject { 
let local = ...; 
return local; 

} 


Jet v = create(); 





完全 可 能 被 优化 为 类 似 如 下 的 效果 : 


fn create(p: &mut Bigobject) { 
ptr::write(p, ...); 


let mut v: BigObject = uninitialized(); 
create(&mut v); 


编译 器 可 以 提前 在 当前 调用 栈 中 把 大 对 象 的 空间 分 配 好 ， 然 后 把 这 


个 对 象 的 指针 传递 给 也 函数 ， 由 子 函 数 执行 这 个 变量 的 初始 化 。 这 样 束 
避免 了 大 对 象 的 复制 工作 ， 参 数 传 递 只 是 一 个 指针 而 已 。 这 么 做 是 完 
满足 移动 语义 要 求 的 ， 而 且 编 译 占 还 有 权利 做 更 多 类 似 的 优化 。 





11.3 复制 语义 


默认 的 move 语 义 是 Rust 的 一 个 重要 设计 ， 但 是 任何 时 候 需 要 复制 都 
去 调用 clone 函 数 会 显得 非常 烦琐 。 对 于 一 些 简 单 类 型 ， 比 如 整数 、 
bool， 让 它们 在 赋值 的 时 候 默 认 采 用 复制 操作 会 让 语言 更 简单 。 


比如 下 面 这 个 程序 就 可 以 正常 编译 通过 : 


fn main() { 
et vi : isize = 0; 
let v2 = v1; 
println!("{}", v1); 


编译 器 并 没有 阻止 v1 被 使 用 ， 这 是 为 什么 呢 ? 


因为 在 Rust 中 有 一 部 分 “特殊 照顾 ”的 类 型 ， 其 变量 绑 定 操作 是 copy 
语义 。 所 谓 的 copy 语 义 ， 是 指 在 执行 变量 绑 定 操作 的 时 候 ，v2 是 对 v1 上 所 
属 数据 的 一 份 复 制 。v1 所 管理 的 这 块 内 存 依然 存在 ， 并 未 失效 ， 而 v2 是 
新 开辟 了 一 块 内 存 ， 它 的 内 容 是 从 v1 管 理 的 内 存 中 复制 而 来 的 。 和 手动 
调用 clone 方 法 效果 一 样 ，let v2=v1; 等 效 于 let v2=vl.clone () ; 。 


使 用 文件 系统 来 打 比 方 。copy 语 义 就 像 * 复 制 、 粘 贴 ?操作 。 操 作 完 
成 后 ， 原 来 的 数据 依然 存在 ， 而 新 的 数据 是 原来 数据 的 复制 品 。move 
语义 束 像 “是 切 、 粘 贴 ” 操 作 。 操 作 完 成 后 ， 原 来 的 数据 束 不 存在 了 ， 被 
移动 到 了 新 的 地 方 。 这 两 个 操作 本 吴 是 一 样 的 ， 都 是 简单 的 内 存 复制 ， 
区 别 在 于 复制 完 以 后 ， 原 先 那个 变量 的 生命 周期 是 人 否 结束 。 








Rust 中 ， 在 普通 变量 绑 定 、 函 数 传 参 、 模 式 匹 配 等 场景 下 ， 凡 是 实 
现 了 std: : marker: : Copy trait 的 类 型 ， 都 会 执行 copy 语 义 。 基 本 类 
型 ， 比 如 数字 、 字 符 、bool 等 ， 都 实现 了 Copy trait， 因 此 有 具备 copy 语 
Xs 


YY 


对 于 目 定 义 类 型 ， 默 认 是 没有 实现 Copy trait 的 ， 但 是 我 们 可 以 手动 
添上 。 示 例如 下 : 





Struct Foo { 
data : i32 
} 


impl Copy for Foo {} 


fn main() { 
let vi = Foo { data : 0 }; 
let v2 = vi1; 
println!("{:?}", vi.data); 





编译 错误 。 错 误 信 息 是 “the trait*core: : clone: : Clone'`is not 
implemented for the type*Foo”。 覃 一 下 文档 发 现 ， 原 来 Copy 继 承 了 
Clone， 我 们 要 实现 Copy trait 必 须 同时 实现 Clone trait。 把 代码 改 成 : 





Struct Foo { 
data : i32 
} 


impl Clone for Foo { 
fn clone(&self) -> Foo { 
Foo { data : self.data } 
} 


} 
impl Copy for Foo {} 
fn main() { 
let vi = Foo { data : 0 }; 


let v2 = vi1; 
println!("{:?2}", vi.data); 








编译 通过 。 现 在 Foo 类 型 也 拥有 了 复制 语义 。 在 执行 变量 绑 定 、 矣 
数 参 数 传 递 的 时 候 ， 原 来 的 变量 不 会 失效 ， 而 是 会 新 开辟 一 块 内 存 ， 将 
原来 的 数据 复制 过 来 。 


绝 大 部 分 情况 下 ， 实 现 Copy trait 和 Clone trait 是 一 个 非常 机 械 化 
的 、 重 复 性 的 工作 ，clone 方 法 的 函数 体 要 对 每 个 成 员 调 用 一 下 clone 方 
法 。Rust 提 供 了 一 个 编译 器 扩展 derive attribute， 来 帮 有 我 们 写 这 些 代 码 ， 
其 使 用 方式 为 #[derive (Copy，Clone) ]。 只 要 一 个 类 型 的 所 有 成 员 都 
a trait， 我 们 就 可 以 使 用 这 种 方法 来 让 编译 堪 帮 我 们 实现 Clone 
trait 」 。 


示例 如 下 : 











#[derive(Copy, Clone)] 
struct Foo { 


data : i32 
} 
fn main() { 
let vi Foo { data : 0 }; 


let v2 = vi1; 
println!("{:?}", vi1.data); 


11.4 ” Box 类 型 





Box 类 型 是 Rust 中 一 种 常用 的 指针 类 型 。 它 代表 “拥有 所 有 权 的 指 
针 ”， 类 似 于 C++ 里 面 的 unique_ptr (严格 来 说 ，uniqgue_ptr<T> 更 像 
Option<Box<T>>) 。 用 法 如 下 : 





struct T{ 
value: i32 
} 


fn main() { 
let p = Box::new(T{value: 1}); 
println!("{}", p.value); 

} 





Box 类 型 永远 执行 的 是 move 语 义 ， 不 能 是 copy 语 义 。 原 因 大 家 想 想 
束 可 以 明日 ， Rust 中 的 copy 语 义 就 是 浅 复 制 。 对 于 Box 这 样 的 类 型 而 
言 ， 浅 复制 必然 会 造成 二 次 释放 问题 。 


对 于 Rust 里 面 的 所 有 变量 ， 在 使 用 前 一 定 要 合理 初始 化 ， 否 则 会 出 
现 编译 错误 。 对 于 Box<T>/&T/&mnut T 这 样 的 类 型 ， 合 理 初始 化 意味 着 
它 一 定 指向 了 某 个 具体 的 对 象 ， 不 可 能 是 空 。 如 果 用 户 确实 需要 “可 能 
为 空 的 ”指针 ， 必 须 使 用 类 型 Option<Box<T>>。 


Rust 里 面 还 有 一 个 保留 关键 字 box (注意 是 小 写 ) 。 它 可 以 用 于 把 
变量 “ 装 箱 ” 到 堆 上 。 目 前 这 个 语法 依然 是 unstable 状 态 ， 需 要 打开 feature 
gate 才 能 使 用 ， 示 例如 下 : 








#![feature(box_syntax)] 


struct T{ 
value: i32 
} 


fn main() { 
let p : Box<T> = box T{value: 1}; 
println!("{}", p.value); 

} 





这 种 写法 和 Box: : new() 函数 调用 并 没有 本 质 区 别 。 将 来 box 关 





键 字 可 能 会 同样 文 持 各 种 智能 指针 ， 从 而 根据 上 下 文 信息 自动 判断 执 
行 。 比 如 letp: Rc<T>=box T{value: 1}; 就 可 以 构造 一 个 Rc 指 针 。 


11.5 Clone VS.Copy 


Rust 中 的 Copy 是 一 个 特殊 的 trait， 它 给 类 型 提供 了 “复制 * 语 义 。 在 
Rnust 标 准 库 里 面 ， 还 有 一 个 跟 它 很 相近 的 trait， 叫 作 Clone。 很 多 人 容易 
把 这 两 者 混 请 ， 本 节 专 门 来 谈 一 谈 这 两 个 trait。 


11.5.1 ”Copy 的 含义 


Copy 的 全 名 是 std: : marker: : Copy。 请 大 家 注意 ，std: : 
marker 模 块 里 面 所 有 的 trait 都 是 特殊 的 trait。 目 前 稳定 的 有 四 个 ， 它 们 是 
Copy、Send、Sized、Sync。 它 们 的 特殊 之 处 在 于 : 它们 是 跟 编译 器 密 
切 绑 定 的 ，impl 这 些 trait 对 编译 器 的 行为 有 重要 影响 。 在 编译 器 眼 里 ， 
它们 与 其 他 的 trait 不 一 样 。 这 几 个 trait 内 部 都 没有 方法 ， 它 们 的 唯一 任 
务 是 给 类 型 打 一 个 “标记 ”， 表明 它 符合 某 种 约定 一 一 这 些 约定 会 影响 编 
译 器 的 静态 检查 以 及 代码 生成 。 


Copy 这 个 trait 在 编译 器 的 眼 里 代表 的 是 什么 意思 呢 ? 简单 点 总 结 就 
是 ， 如 果 一 个 类 型 impl1 了 Copy trait， 意 味 着 任何 时 候 ， 我 们 都 可 以 通过 
简单 的 内 存 复制 〈 在 C 语 言 里 按 字 节 复 制 memcpy) 实现 该 类 型 的 复制 ， 
并 且 不 会 产生 任何 内 存 安全 问题 。 


一 旦 一 个 类 型 实现 了 Copy trait， 那 么 它 在 变量 绑 定 、 函 数 参数 传 
递 、 函 数 返 回 值 传递 等 场景 下 ， 都 是 copy 语 义 ， 而 不 再 是 默认 的 move 语 
Ms 














下 面 用 最 简单 的 赋值 语句 x=y 来 说 明 move 语 义 和 copy 语 义 的 根本 区 
别 。move 语 义 是 “ 剪 切 、 粘 贴 ? 操 作 ， 变 量 y 把 所 有 权 递 交 给 了 x 之 后 ，y 
就 彻底 失效 了 ， 后 面 继续 使 用 y 束 会 出 编译 错误 。 而 copy 语 义 是 “复制 、 
粘贴 ?操作 ， 变 量 y 把 所 有 权 递 交 给 了 x 之 后 ， 它 自己 还 留 了 一 个 副本 ， 
在 这 人 句 赋值 语句 之 后 ，x 和 y 依 然 都 可 以 继续 使 用 。 


在 Rust 里 ，move 语 义 和 copy 语 义 具体 执行 的 操作 ， 是 不 允许 由 程序 
员 上 自 定 义 的 ， 这 是 它 和 C++ 的 巨大 区 别 。 这 里 没有 赋值 构造 函数 或 者 赋 
值 运算 符 重 载 。move 语 义 或 者 copy 语 义 都 是 执行 的 nemcpy， 无 法 更 
改 ， 这 个 过 程 中 绝对 不 存在 其 他 副作用 。 当 然 ， 这 里 一 直 谈 的 是 “ 语 





义 ”， 而 没有 涉及 编译 器 优化 。 从 语义 的 角度 ， 我 们 要 讲 清楚 ， 什 么 样 
的 代码 在 编译 器 看 来 是 合法 的 ， 什 么 样 的 代码 是 非法 的 。 如 果 考 虑 后 站 
优化 ， 在 许多 情况 下 ， 不 必要 的 内 存 复制 实际 上 已 经 彻底 优化 挥 了 ， 大 
家 不 必 担 心 执行 效率 的 问题 。 也 没有 必要 每 次 都 把 move 或 者 copy 操 作 与 
具体 的 汇编 代码 联系 起 来 ， 因 为 场景 不 同 ， 优 化 结果 不 同 ， 生 成 的 代码 
也 是 不 同 的 。 大 家 只 需 记 住 的 是 语义 。 











11.5.2 Copy 的 实现 条 件 





并 不 是 所 有 的 类 型 都 可 以 实现 Copy trait。 Rust 规 定 ， 对 于 目 定 义 闫 
型 ， 只 有 所 有 成 员 都 实现 了 Copy trait， 这 个 类 型 才 有 资格 实现 Copy 
trait。 





和 常见 的 数字 类 型 、bool 类 型 、 共 享 借用 指针 &， 都 是 具有 Copy 属 性 
的 类 型 。 而 Box、Vec、 可 写 借用 指针 &mut 等 类 型 都 是 不 具备 Copy 属 性 
的 类 型 。 


对 于 数组 类 型 ， 如 果 它 内 部 的 元 素 类 型 是 Copy， 那 么 这 个 数组 也 是 
Copy 类 型 。 


对 于 元 组 tuple 类 型 ， 如 果 它 的 每 一 个 元 素 都 是 Copy 类 型 ， 那 么 这 个 
tuple 也 是 Copy 类 型 。 


struct 和 enum 类 型 不 会 自动 实现 Copy trait。 只 有 当 struct 和 enum 内 部 
的 每 个 元 素 都 是 Copy 类 型 时 ， 编 译 嚣 才 人 允许 我 们 针对 此 类 型 实现 Copy 
trait。 比 如 下 面 这 个 类 型 ， 虽 然 它 的 成 员 是 Copy 类 型 ， 但 它 本 号 不 是 
Copy 类 型 : 








Struct T(i32); 


fn main() { 

let t1 = T(1); 

let t2 = t1; 

println!i("{} {}", t1.0, t2.0); 
} 














编译 可 见 编译 错误 。 原 因 是 在 let t2=tl1; 这 条 语句 中 执行 的 是 move 
语义 。 但 是 我 们 可 以 手动 为 它 impl Copy trait， 这 样 它 束 具 备 了 copy 语 


我 们 可 以 认为 ，Rust 中 只 有 POD (C++ 语 言 中 的 Plain Old Data) 类 
型 才 有 资格 实现 Copy trait。 在 Rust 中 ， 如 果 一 个 类 型 只 包含 POD 数 据 类 
型 的 成 员 ， 并 且 没 有 自 定义 析 构 函数 ， 那 它 就 是 POD 类 型 。 比 如 : 整 
数 、 浮 点 数 、 只 包含 POD 类 型 的 数组 等 ， 都 属于 POD 类 型 ， 而 Box 
String Vec 等 不 能 按 字 节 复制 的 类 型 ， 都 不 属于 POD 类 型 。 但 是 ， 反 过 
来 讲 ， 也 并 不 是 所 有 满足 POD 的 类 型 都 应 该 实现 Copy trait， 是 否 实现 
Copy 取 决 于 业务 需求 。 


11.5.3 Clone 的 含义 


Clone 的 全 名 是 std: : done: : Clone。 它 的 完整 声明 如 下 : 





pub trait Clone : Sized { 
fn clone(&self) -> Self; 
fn clone_from(&mut self, source: &Self) { 
*self = source.clone() 
} 
} 





它 有 两 个 关联 方法 ， 分 别 是 clone_from 和 clone，clone_from 是 有 默 
认 实 现 的 ， 依 赖 于 clone 方 法 的 实现 。clone 方 法 没有 默认 实现 ， 需 要 手 
动 实现 。 


clone 方 法 一 般 用 于 “基于 语义 的 复制 ”操作 。 所 以 ， 它 做 什么 事情 ， 
跟 具 体 类 型 的 作用 息 奶 相关 。 比 如 ， 对 于 Box 类 型 ，clone 执 行 的 是 “ 深 
复制 ”而 对 于 Rc 类 型 ，clone 做 的 事情 就 是 把 引用 计数 值 加 1。 


虽然 Rust 中 的 clone 方 法 一 般 是 用 来 执行 复制 操作 的 ， 但 是 如 果 在 目 
定义 的 clone 函 数 中 做 点 别 的 什么 工作 ， 编 译 器 也 没 办 法 禁止 。 你 可 以 根 
据 需 要 在 clone 函 数 中 编写 任意 的 好 辑 。 


但 是 有 一 条 规则 逢 要 注意 :对 于 实现 了 copy 的 类 型 ， 它 的 clone 方 法 
应 该 跟 copy 语 义 相 容 ， 等 同 于 按 字 节 复 制 。 











11.5.4 ”自动 derive 


绝 大 多 数 情况 下 ， 实 现 Copy Clone 这 样 的 trait 都 是 一 个 重复 而 无 聊 
的 工作 。 因 此 ，Rust 提 供 了 一 个 attribute， 让 我 们 可 以 利用 编译 器 自动 生 
成 这 部 分 代码 。 示 例如 下 : 





#[derive(Copy, Clone)] 
Struct MyStruct(i32); 





这 里 的 derive 会 让 编译 器 帮 有 我 们 上 自动 生成 impl Copy 和 impl Clone 这 
样 的 代码 。 自 动 生 成 的 cone 方 法 ， 会 依次 调用 每 个 成 员 的 clone 方 法 。 


通过 derive 方 式 上 自动 实现 Copy 和 手工 实现 Copy 有 微小 的 区 别 。 当 类 
型 具有 泛 型 参数 的 时 候 ， 比 如 struct MyStruct<T>{}， 通 过 derive 自 动 生 
成 的 代码 会 自动 添加 一 个 T: Copy 的 约束 。 


目前 ， 只 有 一 部 分 固定 的 特殊 trait 可 以 通过 derive 来 自动 实现 。 将 来 
Rust 会 允许 自 定义 的 derive 行 为 ， 让 我 们 自己 的 trait 也 可 以 通过 derive 的 
方式 自动 实现 。 


11.5.5 总结 


Copy 和 Clone 两 者 的 区 别 和 联系 如 下 。 
Copy 内 部 没有 方法 ，Clone 内 部 有 两 个 方法 。 


Copy trait 是 给 编译 器 用 的 ， 告 诉 编译 器 这 个 类 型 默认 采用 copy 语 
义 ， 而 不 是 move 语 义 。Clone trait 是 给 程序 员 用 的 ， 我 们 必须 手动 调用 
clone 方 法 ， 它 才能 发 挥 作用 。 


Copy trait 不 是 想 实 现 就 能 实现 的 ， 它 对 类 型 是 有 要 求 的 ， 有 些 类 
型 不 可 能 impl Copy。 而 Clone trait 则 没有 什么 前 提 条 件 ， 任 何 类 型 都 可 
以 实现 〈unsized 类 型 除外 ， 因 为 无 法 使 用 unsized 类 型 作为 返回 值 ) 。 


.Copy trait 规 定 了 这 个 类 型 在 执行 变量 绑 定 、 函 数 参 数 传递 、 函 数 
返回 等 场景 下 的 操作 方式 。 即 这 个 类 型 在 这 种 场景 下 ， 必 然 执行 的 
是 “ 徐 单 内 存 复制 ?操作 ， 这 是 由 编译 堪 保 证 的 ， 程 序 员 无 法 控制 。 
Clone trait 里 面 的 clone 方 法 究竟 会 执行 什么 操作 ， 则 是 取决 于 程序 员 自 
己 写 的 逻辑 。 一 般 情 况 下 ，clone 方 法 应 该 执行 一 个 “ 深 复 制 ? 操 作 ， 但 这 





不 是 强制 性 的 ， 如 果 你 愿意 ， 在 里 面 局 动 一 个 人 工 智 能 程序 都 是 有 可 能 
的 。 


如果 你 确实 不 需要 Clone trait 执 行 其 他 目 定 义 操作 《〈 绝 大 多 数 情况 
都 是 这 样 ) ， 编 译 器 提供 了 一 个 工具 ， 我 们 可 以 在 一 个 类 型 上 添加 # 
[derive 〈Clone) ]， 来 让 编译 器 帮 有 我 们 上 自动 生成 那些 重复 的 代码 。 编 译 
峰 目 动 生 成 的 clone 方 法 非常 机 械 ， 束 是 依次 调用 每 个 成 员 的 clone 方 
;大 s 


:Rust 语 言 规定 了 在 T: Copy 的 情况 下 ，Clone trait 代 表 的 含义 。 即 : 
当 某 变量 t; T 符 合 T: Copy 时 ， 它 调用 t.clone() 方法 的 含义 必须 等 同 
于 “简单 内 存 复制 ?>。 也 就 是 说 ，clone 的 行为 必须 等 同 于 let x=std: : 
ptr: : read (&t) ; ， 也 等 同 于 let x=t;，。 当 T: Copy 时 ， 我 们 不 要 在 
Clone trait 里 面 乱 写 自己 的 逻辑 。 所 以 ， 当 我 们 需要 指定 一 个 类 型 是 
Copy 的 时 候 ， 最 好 使 用 #[derive (Copy，Clone) ] 方 式 ， 避 免 手 动 实现 
Clone 导 致 错误 。 





11.6 ” 析 构 函数 


所 谓 “ 析 构 函 数 ”(destructor) ， 是 与 “构造 函数 ”(constructor) 相 
对 应 的 概念 。“ 构 造 函 数 ” 是 对 象 补 创建 的 时 候 调 用 的 函数 ，“ 析 构 函 
数 ” 是 对 象 被 销毁 的 时 候 调 用 的 函数 。 


Rust 中 没有 统一 的 “构造 函数 ”这 个 语法 ， 对 象 的 构造 是 直接 对 每 个 
0 


O 








相对 于 构造 函数 ， 析 构 函 数 有 更 重要 的 作用 。 它 会 在 对 象 消亡 之 前 
由 编译 器 上 自动 调用 ， 因 此 特别 适合 承担 对 象 销毁 时 释放 所 拥有 的 资源 的 
作用 。 比 如 ，Vec 类 型 在 使 用 的 过 程 中 ， 会 根据 情况 动态 申请 内 存 ， 当 
变量 的 生命 周期 结束 时 ， 就 会 触发 该 类 型 的 析 构 函数 的 调用 。 在 析 构 函 
数 中 ， 我 们 残 有 机 会 将 所 拥有 的 内 存 释 放 挥 。 在 析 构 函数 中 ， 我 们 还 可 
以 根据 需要 编写 特定 的 逻辑 ， 从 而 达到 更 多 的 目的 。 析 构 函 数 不 仅 可 以 
用 于 管理 内 存 资源 ， 还 能 用 于 管理 更 多 的 其 他 资源 ， 如 文件 、 锁 、 


socket 等 。 


在 C++ 中 ， 利 用 变量 生命 周期 绑 定 资源 的 使 用 周期 ， 已 经 是 一 种 常 
用 的 编程 惯例 。 此 手法 被 称 为 RAII (Resource Acquisition Is 
Initialization) 。 在 变量 生命 周期 开始 时 申请 资源 ， 在 变量 生命 周期 结束 
时 利用 析 构 函数 释放 资源 ， 从 而 达到 自动 化 管理 资源 的 作用 ， 很 大 程度 
上 减少 了 资源 的 泄露 和 误 用 。 


在 Rust 中 编写 < 析 构 函数 ”的 办 法 是 impl std: : ops: : Drop。Drop 
trait 的 定义 如 下 : 











trait Drop { 
fn drop(&mut self); 


Drop trait 允 许 在 对 象 即 将 消亡 之 时 ， 自 行 调 用 指定 代码 。 我 们 来 写 
一 个 自 币 析 构 函数 的 类 型 。 示 例如 下 : 





use std::ops::Drop; 


Struct D(i32); 
ImplL Drop for D { 
fn drop(&mut self) { 
println!("destruct {}", self.0); 


fn main() { 
let x = D(1); 
println!("construct 1"); 
let y = D(2); 
println!("construct 2"); 
println!("exit inner scope"); 


println!("exit main function"); 





编译 ， 执 行 结果 为 : 


construct 1 
construct 2 

exit inner scope 
destruct 2 

exit main function 
destruct 1 


从 上 面 这 段 程序 可 以 看 出 析 构 函数 的 调用 时 机 。 变 量 _ y 的 生存 期 是 
内 部 的 大 括号 包围 起 来 的 作用 域 (scope〉， 待 这 个 作用 域 中 的 代码 执 
行 完 之 后 ， 它 的 析 构 函数 就 补 调 用， 变量 _x 的 生存 期 是 整个 main 函 数 包 
0 
数 就 被 调用 。 


对 于 具有 多 个 局 部 变量 的 情况 ， 析 构 函 数 的 调用 顺序 是 : 移 构 造 的 
后 析 构 ， 后 构造 的 先 析 构 。 因 为 局 部 变量 存在 于 一 个 “ 栈 ” 的 结构 中 ， 要 
保持 “先进 后 出 ”的 策略 。 











11.6.1 资源 管理 


在 创建 变量 的 时 候 获 取 某 种 资源 ， 在 变量 生命 周期 结束 的 时 候 释 放 
资源 ， 是 一 种 常见 的 设计 模式 。 这 里 的 资源 ， 不 仅 可 以 包括 内 存 ， 还 可 
以 包括 其 他 向 操作 系统 申请 的 资源 。 比 如 我 们 经 常用 到 的 File 类 型 ， 会 
在 创建 和 使 用 的 过 程 中 向 操作 系统 申请 打开 文件 ， 在 它 的 析 构 函数 中 就 
会 去 释放 文件 。 所 以 ，RAII 手 法 是 比 GC 更 通用 的 资源 管理 手段 ，GC 只 





能 管理 内 存 ，RAII 可 以 管理 各 种 资源 。 
下 面 用 Rust 标 准 库 中 的 “文件 ”类 型 ， 来 展示 一 下 RAII 手 法 。 示 例如 








use std::fs::File; 
use std::io::Read; 


fn main() { 

let f = File::open("/target/file/path"); 

if f.is err() { 
println!("file is not exist."); 
return; 

} 

let mut f = f.unwrap(); 

let mut content = String::new(); 

let result = f.read to_string(&mut content); 

If result,is_err() 
println!("read file error."); 
return; 


} 
println!("{}", result.unwrap()); 





除去 那些 错误 处 理 的 代码 以 后 ， 整 个 逻辑 实际 上 相当 清晰 : 首先 使 
用 open 函 数 打开 文件 ， 然 后 使 用 read_to_string 方 法 读 取 内 容 ， 最 后 关闭 
文件 ， 这 里 不 需要 手动 天 财 文件 ， 因 为 在 File 类 型 的 析 构 函数 中 已 经 目 
动 处 理 好 了 关闭 文件 这 件 事情 。 


再 比如 标准 库 中 的 各 种 复杂 数据 结构 (如 Vec LinkedList HashMap 
Ss 已 们 言 理 了 很 多 在 准 上 动态 分 配 的 内 存 。 它 们 也 是 利用 “ 析 构 函 
数 ” 这 个 功能 ， 在 生命 终结 之 前 释放 了 申请 的 内 存 空间 ， 因 此 无 须 像 C 语 
豆 言 那样 手动 调用 free 函 数 。 











11.6.2 “主动 析 构 





一 般 情 况 下 ， 局 部 变量 的 生命 周期 是 从 它 的 声明 开始 ， 到 当前 语句 
块 结束 。 然 而 ， 我 们 也 可 以 手动 提前 结束 它 的 生命 周期 。 请 注意 ， 用 户 
主动 调用 析 构 函数 是 非法 的 ， 示 例如 下 : 








fn main() { 
let p = Box: :new(42); 
p.drop(); 


println!("{}", p); 








编译 ， 可 见 错误 信息 : 





error[E0040]: explicit use of destructor method 
--> test.rs:5:7 


| 
5 | p.drop(); 
| AAAA explicit destructor calls not allowed 





这 说 明 编 译 占 不 允许 手动 调用 析 构 函数 。 那 么 ， 我 们 怎样 才能 让 局 
部 变量 在 语句 块 结束 前 提前 终止 生命 周期 呢 ? 办 法 是 调用 标准 库 中 的 
std: : mem: : drop 函 数 : 








use std::mem::drop; 


fn main() { 






































let mut v = vec![1, 2, 3]; // <--- Vv 的 生命 周期 开始 
drop(v); // ---> Vv 的 生命 周期 结 
Vv.push(4); // 错误 的 调用 








} 





这 上 段 代码 会 编译 出 错 ， 是 因为 调用 drop 方 法 的 时 候 ，v 的 生命 周期 
束 结 束 了 ， 后 面 继续 使 用 变量 v 束 会 友 生 编译 错误 。 


于 从 ， 标准 库 中 的 std: : mem: : drop 消 数 是 怎样 实现 的 呢 ? 可 能 
许多 人 想不到 的 是 ， 这 个 函数 是 Rust 中 最 简单 的 函数 ， 因 为 它 的 实现 
为 “ 空 ”: 





#[inline] 
pub fn drop<T>(_x: T) { } 








drop 函 数 不 需 要 任何 的 函数 体 ， 只 需要 参数 为 “ 值 传 递 ”? 即 可 。 将 对 
I 什么 都 不 用 做 ， 编 译 絮 束 会 目 动 释放 挥 这 个 对 


因为 这 个 drop 函 数 的 关键 在 于 使 用 move 语 义 把 参数 传 进来 ， 使 得 变 
量 的 所 有 权 从 调用 方 移动 到 drop 溺 数 体内 ， 参 数 类 型 一 定 要 是 T， 而 不 
是 &T 或 者 其 他 引用 类 型 。 函 数 体 本 喘 其 实 根 本 不 重要 ， 重 要 的 是 把 变 








量 的 所 有 权 move 进 入 这 个 函数 体 中 ， 函 数 调 用 结束 的 时 候 该 变量 的 生 

命 周 期 结束 ， 变量 的 术 构 函数 会 目 动 调 用 ， 管理 的 内 存 空间 也 会 自然 释 
放 。 这 个 过 程 完全 符合 前 面 讲 的 生命 周期 、move 语 义 ， 无 须 编译 器 做 
特殊 处 理 。 事实 上 ， 我 们 完全 可 以 目 己 写 一 个 类 似 的 函数 来 实现 同样 的 
效果 ， 只 要 保证 参数 传递 是 move 语 义 即 可 。 


因此 ， 对 于 Copy 类 型 的 变量 ， 对 它 调用 std: : mem: : drop 函 数 是 
没有 意义 的 。 下 面 以 整数 类 型 作为 示例 来 说 明 : 





use std::mem: :drop; 


fn main() { 
let x = 1 i32 
pranti mC 'before drop {}", x); 
drop(x); 
print1ln!( 'after drop {€}", x); 
} 





这 种 况 很 容易 理解 。 因 为 Copy 类 型 在 函数 参数 传递 的 时 候 执行 的 
是 复制 语 ， 原 来 的 那个 变量 依然 存在 ， 传 入 函数 中 的 只 是 一 个 复制 
品 ， 因此 厌 灾 量 的 生命 周期 不 会 受到 影响 。 


变量 遮 责 〈Shadowing) 不 会 导致 变量 生命 周期 提前 结束 ， 它 不 等 
同 于 drop。 示 例如 下 : 








use std::ops::Drop; 
struct D(i32); 


impl Drop for D { 
fn drop(&mut self) 
println!("destructor for {}", self.0); 


} 


fn main() { 
let x = D(1); 
println!("construct first variable"); 
let x = D(2); 
println!("construct second variable"); 


} 





编译 ， 执行 ， 输出 的 吉 果 为 : 





construct first variable 
construct second variable 
destructor for 2 
destructor for 1 





这 里 函数 调用 的 顺序 为 ， 先 创建 第 一 个 x*， 再 创建 第 二 个 x， 退 出 孙 
数 的 时 候 ， 先 析 构 第 二 个 x， 再 析 构 第 一 个 x。 由 此 可 见 ， 在 第 二 个 x 出 
现 的 时 候 ， 虽 然 将 第 一 个 x 遮 巩 起 来 了 ， 但 是 第 一 个 x 的 生命 周期 并 未 结 
束 ， 它 依然 存在 ， 直 到 函数 退出 。 这 也 说 明了 ， 虽 然 这 两 个 变量 绑 定 了 
同一 个 名 字 ， 但 在 编译 器 内 部 依然 将 它们 视 为 两 个 不 同 的 变量 。 


另外 还 有 一 个 小 问题 需要 提醒 读者 注意 ， 那 就 是 下 划 线 这 个 特殊 符 
写 。 请 注意 : 如 条 你 用 下 划 线 来 绑 定 一 个 变量 ， 那 么 这 个 变量 会 当场 执 
行 析 构 ， 而 不 是 等 到 当前 语句 块 结束 的 时 候 再 执行 。 下 划 线 是 特殊 符 
号， 不 是 普通 标识 和 从。 示例 如 下 : 




















use std::ops::Drop; 
struct D(i32); 


impl Drop for D { 
fn drop(&mut self) { 
println!("destructor for {}", self.0); 
} 
} 


fn main() { 
let x = D(1); 





let _ = D(2); 
let jy = D(3); 

} 
执行 结果 为 : 





destructor for 2 
destructor for 3 
destructor for 1 





之 所 以 是 这 样 的 结果 ， 是 因为 用 下 划 线 绑 定 的 那个 变量 当场 就 执行 
了 析 构 ， 而 其 他 两 个 变量 等 到 语句 块 结 束 了 才 执 行 析 构 ， 而 且 析 构 顺 序 
和 初始 化 顺序 刚好 相反 。 所 以 ， 如 果 大 家 需要 利用 RAII 实 现 某 个 变量 的 
i 
这 个 变量 。 











最 后 ， 请 大 家 注意 区 分 ，std: : mem: : drop () 函数 和 std:， : 
ops: : Drop: : drop〈) 方法 。 


1) std: : mem: : drop〈) 函数 是 一 个 独立 的 函数 ， 不 是 某 个 类 
型 的 成 员 方法 ， 它 由 程序 员 主 动 调用 ， 作 用 是 使 变量 的 生命 周期 提前 结 
束 ; std: : ops: : Drop: : drop() 方法 是 一 个 trait 中 定义 的 方法 ， 当 
0 编译 器 会 自动 调用 ， 手 动 调用 是 不 允许 


2) std: : mem: : drop<T>(_x: 工 ) 的 参数 类 型 是 T， 采 用 的 是 
move 语 义 ; std: : ops: : Drop: : drop(&mut self) 的 参数 类 型 是 
&mnut Self， 采 用 的 是 可 变 借用 。 在 析 构 函数 调用 过 程 中 ， 我 们 还 有 机 会 
读 取 或 者 修改 此 对 象 的 属性 。 


11.6.3 Drop VS.Copy 





前 面 已 经 讲 了 ， 要 想 实 现 Copy trait， 类 型 必须 满足 一 定 条 件 。 这 个 
条 件 就 是 : 如 果 一 个 类 型 可 以 使 用 memcpy 的 方式 执行 复制 操作 ， 且 没 
有 内 存 安全 问题 ， 那 么 它 才 能 被 允许 实现 Copy trait。 反 过 来 ， 所 有 满足 
Copy trait 的 类 型 ， 在 需要 执行 move 语 义 的 时 候 ， 使 用 memcpy 复 制 一 份 
副本 ， 不 删除 原件 是 完全 不 会 产生 安全 问题 的 。 


本 节 中 需要 强调 的 是 ， 带 有 析 构 函数 的 类 型 都 是 不 能 满足 Copy 语 义 
的 。 因 为 我 们 不 能 保证 ， 对 于 带 析 构 函 数 的 类 型 ， 使 用 memcpy 复 制 一 
， 定 不 会 有 内 存 安全 问题 。 所 以 对 于 这 种 情况 ， 编 译 器 是 直接 茶 
目的 。 


同样 ， 下 面 还 是 用 示例 来 说 明 : 




















use std::ops::Drop; 
struct T; 
impl Drop for T 

fn drop(&mut self){} 
impl Copy for T {} 


fn main() 他 


| | 





编译 ， 可 见 编译 错误 : 





error[E0184]: the trait ‘Copy may not be implemented for this type the type has a 
--> test.rs:9:1 
| 
9 | impl Copy for T 0} 
| AAAAAAAAAAAAAAAAAA Copy not allowed on types with destructors 











普 误 信息 说 得 清 清楚 楚 ， 带 有 析 构 函数 的 类 型 不 能 是 Copy。 这 两 个 
身份 是 不 能 同时 存在 于 一 个 类 型 上 的 。 


11.6.4” 析 构 标 记 


在 Rust 里 面 ， 析 构 函 数 是 在 变量 生命 周期 结束 的 时 候 锐 调用 的 。 然 
而 ， 既 然 我 们 可 以 手动 提前 终止 变量 的 生命 周期 ， 那 么 就 说明 ， 变 量 的 
生命 周期 并 不 是 简单 地 与 茶 个 代码 块 一 致 ， 生 命 周期 何 时 结束 ， 很 可 能 
是 由 运行 时 的 条 件 决 定 的 。 下 面 用 一 个 示例 来 说 明 变 量 的 析 构 函数 调用 
时 机 是 有 可 能 在 运行 阶段 发 生 改变 的 : 











use std::ops::Drop; 
use std::mem::drop; 


struct D(&'static str); 
impl Drop for Df{ 
fn drop(&mut self) { 
println!("destructor {}", self.0); 


} 
// 获取 DROP 环境 变量 的 值 , 并 转换 为 整数 


fn condition() -> Option<u32> { 
std: :env::var("DROP") 
.map(|s| s.parse::<u32>().unwrap_or(0)) 
.Ok() 





} 


fn main() { 
let var = (D("first"), D("second"), D("third")); 
match condition() { 
Some(1) => drop(var.0), 
Some(2) => drop(var.1), 
Some(3) => drop(var.2), 
— => {}, 


println!("main end"); 


ee | 


在 上 面 这 段 示 例 代 码 中 ， 我 们 在 变量 的 析 构 函数 中 写 了 一 条 打印 语 
句 ， 用 于 判断 析 构 函数 的 调用 顺序 。 在 主 函数 里 面 ， 则 通过 判断 当前 的 
环境 变量 信息 来 决定 是 否 提 前 终止 人 菜 个 变量 的 生命 周期 。 


编译 执行 ， 如 果 我 们 没有 设置 DROP 环 境 变量 ， 输 出 结果 为 : 





main end 
destructor first 
destructor second 
destructor third 





如 果 我 们 设置 了 export DROP=2 这 个 环境 变量 ， 不 重新 编译 ， 执 行 
同样 的 代码 ， 输 出 结果 为 : 





destructor second 
main end 
destructor first 
destructor third 





我 们 还 可 以 将 DROP 环 境 变 量 的 值 分 别 改 为 “1”、“2”、“3”， 结 果 会 
导致 术 构 函数 的 调用 顺序 发 生变 化 。 


然而 ， 问 题 来 了 ， 前 面 说 过 ， 析 构 函 数 的 调用 是 在 编译 阶段 束 确 定 
好 了 的 ， 调 用 析 构 函数 是 编译 喜 目 动 插入 的 代码 做 的 。 而 且 示 例 又 表 
析 构 函数 的 有 具体 调用 时 机 还 是 跟 运 行 时 的 情况 相关 的 。 那 么 编译 器 
怎么 做 到 的 呢 ? 


编译 器 是 这 样 完成 这 个 功能 的 : 首先 判断 一 个 变量 是 否 可 能 会 在 多 
个 不 同 的 路 径 上 友 生 析 构 ， 如 果 是 这 样 ， 那 么 它 会 在 当前 函数 调用 栈 中 
目 动 插 入 一 个 bool 类 型 的 标记 ， 用 于 标记 该 对 象 的 析 构 函数 是 否 已 经 被 
调用 ， 生 成 的 代码 逻辑 像 下 面 这 样 : 














// 以 下 为 伪 代 码 , 仅仅 是 示意 
fn main() { 
let var = (D("first"), D("second"), D("third")); 
// 当 函 数 中 有 有 所 有 权 的 对 象 时 ， 需要 有 析 构 自动 标记 
let drop_flag 0 = false; / 
let drop_flag 1 = false; // --- 
let drop_flag 2 = false; // --- 









































// 退出 语句 块 时 , 对 当前 block 内 拥有 所 有 权 的 对 象 调用 析 构 函数 ,并 设置 标记 


match condition() { 









































Some(1) => { 
drop(var.0); 


if (!drop_flag 0) { // --- 
drop_flag 0 = true; // --- 
// 


} 
Some(2) => { 
drop(var.1); 


if (!drop_flag 1) { // --- 
drop_flag 1 = true; // --- 
// - 


} 
Some(3) => { 
drop(var .2); 


if (!drop_flag 2) { // --- 
drop_flag 2 = true; // --- 
// 
} 
-=> {}, 


println!("main end"); 
// 退出 语句 块 时 ,对 当前 block 内 拥有 所 有 权 的 对 象 调用 析 构 函数 , 并 设置 标记 
if (!drop_flag 0) { // --- 






























































drop(var .0); // --- 
drop_flag 0 = true; // --- 
} // --- 
if (!drop_flag 1) { // --- 
drop(var.1); // --- 
drop_flag 1 = true; // --- 
} // --- 
if (!drop_flag 2) { // --- 
drop(var .2); // --- 
drop_flag 2 = true,; // --- 
} // --- 








编译 项 生成 的 代码 类 似 于 上 面 的 示例 ， 可 能 会 有 细微 送别 。 原 理 是 
在 析 构 函数 被 调用 的 时 候 ， 就 把 标记 设置 一 个 状态 ， 在 各 个 可 能 调用 析 
构 函 数 的 地 方 都 先 判断 一 下 状态 再 调用 析 构 函数 。 这 样 ， 编 译 阶段 确定 
生命 周期 和 执行 阶段 根据 情况 调用 就 统一 起 来 了 。 


第 12 半 ”借用 和 生命 周期 
12.1 生命 周期 


一 个 变量 的 生命 周期 就 是 它 从 创建 到 销毁 的 整个 过 程 。 其 实 我 们 在 
前 面 已 经 注意 到 了 这 样 的 现象 : 





fn main() { 

















let v = vec![1,2,3,4,5]; // --> v 的 生命 周期 开始 
{ 
let center = v[2]; // --> center 的 生命 周期 开始 





println!("{}", center); 














// <-- center 的 生命 周期 结束 





} 
println!i("{:?}", Vv); 




















// <-- v 的 生命 周期 结束 








然而 ， 如 果 一 个 变量 永远 只 能 有 唯一 一 个 入 口 可 以 访问 的 话 ， 那 就 
太 难 使 用 了 。 因 此 ， 所 有 权 还 可 以 借用 。 


12.2 ”借用 


变量 对 其 管理 的 内 存 拥有 所 有 权 。 这 个 所 有 权 不 仅 可 以 被 转移 
(move) ， 还 可 以 被 借用 (borrow) 。 本 节 讲 解 一 下 如 何 实现 上 所有权 借 
用 。 


借用 指针 的 语法 使 用 & 符 号 或 者 &mnut 符 号 表示 。 前 者 表示 只 读 借 
用 ， 后 者 表示 可 读 写 借用 。 借 用 指针 (borrow pointer) 也 可 以 称 作 * 引 
用 ”(reference〉 。 借 用 指针 与 普通 指针 的 内 部 数据 是 一 模 一 样 的 ， 唯 一 
的 区 别 是 语义 层面 上 的 。 它 的 作用 是 告诉 编译 器 ， 它 对 指 同 的 这 块 内 存 
区 域 没 有 所 有 权 。 


示例 如 下 : 

















fn foo(v: &Vec<i32>) { 
v.push(5); 


fn main() { 
let v = vec![]; 
foo(&v); 

} 





这 里 会 出 现 编译 错误 ， 信 息 为 “cannot borrow immutable borrowed 
content *vy as mutable”。 


原因 在 于 Vec: : push 函 数 。 它 的 作用 是 对 动态 数组 添加 元 素 ， 它 
的 签名 是 





pub fn push(&mut self, value: T) 





它 要 求 self 参 数 是 一 个 &mut Self 类 型 。 而 我 们 给 foo 传 递 的 参数 是 
&Vec 类 型 ， 因 此 会 报错 。 修 复方 式 如 下 : 














// 我 们 需要 “可 变 的 “借用 指针 , 因此 函数 签名 需要 改变 
fn foo(v: &mut Vec<i32>) { 
v.push(5); 




















fn main() { 
// 我 们 需要 这 个 动态 数组 本 身 是 “可 变 的 ”才能 获得 它 的 “可 变 借用 指针 ” 


let mut v = vec![]; 























// 在 函数 调用 的 时 候 , 同时 也 要 显示 获取 它 的 “可 变 借用 指针 ” 
foo(&mut v); 











// 打印 结果 , 可 以 看 到 Vv 已 经 被 改变 
printin!("{:?}", Vv); 




















对 于 &mut 型 指针 ， 请 大 家 注意 不 要 混淆 它 与 变量 绑 定 之 间 的 语 
法 。 如 果 mut 修 饰 的 是 变量 名 ， 那 么 它 代表 这 个 变量 可 以 被 重新 绑 定 ; 
如 果 mut 修 饰 的 是 “借用 指针 &”， 那 么 它 代 表 的 是 被 指 问 的 对 象 可 以 被 
修改 。 示 例如 下 : 








fn main() { 
let mut var = 0 132， 


























let p1 = &mut var; // pl 指针 本 身 不 能 被 重新 绑 定 ,我 们 可 以 通过 p1 改 变 变量 var 的 值 




























































































“pl = 1; 
} 
{ 
let temp = 2_i32; 
let mut p2 = &var， // 我 们 不 能 通过 p2 改 变 变量 var 的 值 , 但 p2 指 针 本 身 指 向 的 位 置 可 以 被 改变 
p2 = &temp; 
} 
{ 
let mut temp = 3_i32, 
let mut p3 = &mut var; // 我 们 既 可 以 通过 p3 改 变 变量 var 的 值 , 而 且 p3 指 针 本 身 指 向 的 位 置 也 
*p3 = 3; 
p3 = &mut temp; 
} 





借用 指针 在 编译 后 ， 实 际 上 束 是 一 个 普通 的 指针 ， 它 的 音义 只 能 在 
编译 阶段 的 静态 检查 中 体现 。 


12.3 ”借用 规则 


关于 借用 指针 ， 有 以 下 几 个 规则 : 
音 用 指针 不 能 比 它 指向 的 变量 存在 的 时 间 更 长 。 


-&mut 型 借用 只 能 指向 本 身上 共有 mut 修 饰 的 变量 ， 对 于 只 读 变 量 ， 
不 可 以 有 &mut 型 借用 。 


'&mnut 型 借用 指针 存在 的 时 候 ， 被 借用 的 变量 本 身 会 处 于 “冻结 ? 状 








.如果 只 有 & 型 借用 指针 ， 那 么 能 同时 存在 多 个 ; 如果 存 在 &mnut 型 
借用 指针 ， 那 么 只 能 存在 一 个 ， 如 果 同 时 有 其 他 的 & 或 者 &mut 型 借用 指 
针 存 在 ， 那 么 会 出 现 编译 错误 。 


借用 指针 只 能 临时 地 拥有 对 这 个 变量 读 或 写 的 权限 ， 没 有 义务 管理 
这 个 变量 的 生命 周期 。 因 此 ， De aa 周期 绝对 不 能 大 于 它 所 引 
人 周期 ， 人 否则 吉 是 悬空 指针 ， 会 导致 内 存 不 安全 。 丰 
列 如 下 : 












































// 这 里 的 参数 采用 的 “引用 传递 ”意味 着 实 参 本 身 并 未 丢失 对 内 存 的 管理 权 


fn borrow_semantics(v : &Vec<i32>) { 


// 打印 参数 占用 空间 的 大 小 ,在 64 位 系统 上 , 结果 为 8, 表明 该 指针 与 普通 裸 指 针 的 内 部 表示 方法 相同 
println!("size of param: {}", std::mem::size of::<&Vec<i32>>()); 
for item in V 

print!("{} ", item); 


















































} 
println!(""); 
} 


// 这 里 的 参数 采用 的 “ 值 传 递 ” 而 Vec 没 有 实现 Copy trait, 意味 着 它 将 执行 move 语 义 


fn move_semantics(v : Vec<i32>) { 


















































B 
这 
也 





// 打印 参数 占用 空间 的 大 小 , 结果 为 24, 表明 实 参 中 栈 上 分 配 的 内 存 空 间 复制 到 了 函数 的 形 
println!("size of param: {}", std::mem::size_of::<Vec<i32>>()); 
for item in vf{ 

print!("{} ", item); 











} 
println!(""); 
} 


fn main() { 
let array = vec![1, 2, 3]; 



































// 需要 注意 的 是 , 如 果 使 用 引用 传递 ,不仅 在 函数 声明 的 地 方 需要 使 用 & 标 记 
// 函数 调用 的 地 方 同样 需要 使 & 标 记 ， 否则 会 出 现 语法 错误 
// 这 样 设 计 主要 是 为 了 显眼 , 不 用 去 阅读 该 函数 的 签名 就 知道 这 个 函数 调用 的 时 候 发 生 了 什么 
// 而 小 数 点 方式 的 成 员 函 数 调用 , 对 于 self 参 数 , 会 “自动 转换 ”, 不 必 显 式 借 用 , 这 里 有 个 区 别 


borrow_semantics(&array ) 


// 在 使 用 引用 传递 给 上 面 的 函数 后 ,array 本 身 依然 有 效 ,我 们 还 能 在 下 面 的 函数 中 使 用 


move_semantics(array); 




















































































































































































































































































































// 在 使 用 move 语 义 传递 后 , array 在 这 个 函数 调用 后 , 它 的 生命 周期 已 经 完结 

















在 这 里 给 大 家 提 个 醒 : 一 般 情 况 下 ， 函 数 参 数 使 用 引用 传递 的 时 
候 ， 不 仅 在 函数 声 1 上 类 型 参数 ， 在 函数 调用 这 里 也 要 显 式 地 
使 用 引用 运算 符 。 但 是 ， 有 一 个 例外 ， 那 就 是 当 参 数 为 self &self &mnut 
self 等 时 ， 知 使 用 小 数 点 语法 调用 成 员 方法 ， 在 函数 调用 这 里 不 能 显 式 
写 出 借用 运算 符 。 以 和 常见 的 String 类 型 来 举例 : 














fn main() { 
// 创建 了 一 个 可 变 的 String 类 型 实例 
let mut x : String = "hello".into(); 














// 调用 len(&self) -> usize 函数 。 self 的 类 型 是 &Self 
// xX.len() 等 同 于 String::len(&x) 
println!("length of String {}", x.len()); 





























// 调用 fn push(&mut self，ch:; char) 函数 。self 的 类 型 是 &mut Self, 因此 它 有 权 对 字符 串 做 人 
// Xx.push('!') 等 同 于 String::push(&mut x,，'!') 
x.push("!'); 





println!("Jlength of String {}", x.len()); 




















// 调用 fn into_bytes(self) -> Vec<u8> 函数 。 注 意 self 的 类 型 , 此 处 发 生 了 所 有 权 转 移 
// x,into_bytes() 等 同 于 String::into_bytes(x) 
let v = x.into_bytes(); 


// 再 次 调用 len( ), 编译 失败 , 因为 此 处 已 经 超过 了 x 的 生命 周期 
//println!("length of String {}", x.1len()); 











在 这 个 示例 中 ， 所 有 的 函 数 调 用 邦 帮 同村 的 1 吾 法 ， 比 如 x.lan〈) 、 
x.push ('! ') 、X.into_bytes () 等 它们 育 5 后 对 self 参 数 的 传递 类 型 
0 因此 也 就 下 现 了 不 同 的 语 语义 。 这 是 需要 提醒 大 家 注意 的 地 

当然 ， 如 果 我 们 使 用 统一 的 完整 函数 调用 语法 ， 那么 所 有 的 参数 传 
第 类型 在 调用 3 前 都 是 显 式 写 出 来 的 。 


任何 借用 指针 的 存在 ， 都 会 导致 原来 的 变量 被 “冻结 ”(EFrozen) 。 





示例 如 下 : 





fn main() { 
let mut x = 1 i32,; 
let p = &mut x; 
x = 2; 
println!("value of pointed : {}", p); 





编译 结果 为 : 





error: cannot assign to ‘x because it is borrowed 








因为 p 的 存在 ， 此 时 对 x 的 改变 被 认为 是 非法 的 。 至 于 为 什么 会 有 这 
样 的 规定 ， 请 参考 下 一 章 。 


12.4 生命 周期 标记 


对 一 个 函数 内 部 的 生命 周期 进行 分 析 ，Rust 编 译 器 可 以 很 好 地 解 
决 。 但 是 ， 当 生命 周期 跨 函 数 的 时 候 ， 束 需要 一 种 特殊 的 生命 周期 标记 


符号 了 。 











12.4.1 函数 的 生命 周期 标记 





示例 如 下 : 
01| struct T { 
02| member: i32, 
03| } 
04| 
05| fn test<'a>(arg: &'a T) -> &'a i32 
06| { 
07 | &arg.member 
08| } 
09| 
10| fn main() { 
11| let t= T { member : 0 }; //----- 't -| 
12| let x = test(&t); //-- 'x ---| | 
13| println!("{:?2}", x); // | | 
14| 7 X ----- t - 





生命 周期 符号 使 用 单 引号 开头 ， 后 面 跟 一 个 合法 的 名 字 。 生 命 周期 
标记 和 泛 型 类 型 参数 是 一 样 的 ， 郑 需要 先 声明 后 使 用 。 在 0 
中 ， 尖 括号 里 面 的 a 是 声明 一 个 生命 周期 参数 ， 它 在 后 面 的 参数 和 返 
值 中 被 使 用 。 


前 面 提 到 的 借用 指针 类 型 都 有 一 个 生命 周期 泛 型 参数 ， 它 们 的 完整 
写法 应 该 是 &a T&a mutT， 只 不 过 在 做 局 部 变量 的 时 候 ， 生 命 周 期 参 
数 是 可 以 省 略 的 。 


生命 周期 之 问 有 重要 的 包含 关系 。 如 果 生 命 周期 'a 比 中 更 长 或 相 
等 ， 则 记 为 'a: bb， 意思 是 'a 至 少 不 会 比 b 短 ， 英 语 读 做 “lifetime a 
outlives lifetime b”。 对 于 借用 指针 类 型 来 说 ， 如 果 &'a 是 合法 的 ， 那 么 b 
作为 'a 的 一 部 分 ，&b 也 一 定 是 合法 的 。 











hs static 是 一 个 特殊 的 生命 8 周期 ， 它 代表 的 是 这 个 程序 从 开始 
到 结束 的 整个 阶段 ， 所 以 它 比 其 他 任何 生命 周期 都 长 。 这 意味 着 ， 任 意 
一 个 生命 周期 'a 都 满足 'static: 'a。 


在 上 面 这 个 例子 中 ， 如 果 我 们 把 变量 t 的 真实 生命 周期 记 为 t， 那 么 

个 生命 周期 实际 上 是 变量 t 从 “出 生 ” 到 “死亡 ”的 区 间 ， 即 从 第 11 行 到 
第 14 行 。 在 函数 被 调用 的 时 候 ， 它 传 入 的 实际 参数 是 &t， 它 是 指 同 t 的 
引用 。 那 么 可 以 说 ， 在 调用 的 时 候 ， 这 个 泛 型 参数 'a 被 实例 化 为 了 Tt。 根 
据 函 数 签 名 ， 基 于 返回 类 型 的 生命 周期 与 参数 是 一 致 的 ， 可 以 推理 出 
test 函 数 的 返回 类 型 是 &ti32。 如 果 我 们 把 x 的 生命 周期 记 为 X， 那么 X 代 
表 的 就 是 从 第 12 行 到 第 14 行 。 这 条 let x=text (&t) ; 语句 实际 上 是 把 &'t 
i32 类 型 的 变量 赋值 给 &x i32 类 型 的 变量 。 这 个 赋 什 是否 合 理 呢 ? 它 应 
该 是 合理 的 。 因 为 这 两 个 生命 周期 的 关系 是 t: x。test 返 回 的 那个 指针 
在 这 个 生命 周期 范围 内 都 是 合 法 的 ， 在 一 个 被 t 包 围 的 更 小 范围 的 生命 
周期 内 ， 它 当然 也 是 合法 的 。 所 以 ， 上 面 这 个 例子 可 以 编译 通过 


接 下 来 ， 我 们 把 上 面 这 个 例子 稍 作 修 改 ， 让 test 函 数 有 两 个 生命 周 
期 参数 ， 其 中 一 个 给 函数 参数 使 用 ， 为 外 一 个 给 返回 值 使 用 : 











fn test<'a, 'b>(arg: &'a T) -> &'b i32 


&arg.member 


编译 时 果然 出 了 问题 ， 在 &arg.member 这 一 行 ， 报 了 生命 周期 错 
误 。 这 是 为 什么 昵 ? 因为 这 一 行 代码 是 把 &'a i32 类 型 赋值 给 &mb i32 类 
型 。'a 和 b 有 什么 关系 ? 管 案 是 什么 关系 都 没有 。 所 以 编译 器 觉得 这 个 
赋值 是 错误 的 。 怎么 修复 呢 ? 指定 a; 了 就 可 以 了 。'a 比 'b“ 活 ”得 长 ， 自 
然 ，&'a i32 类 型 赋值 给 &'b i32 类 型 是 没 问 题 的 。 验 证 如 下 : 


fn test<'a, a &'a T) -> &'b i32 
where 'a: 


&arg.member 


} 





经 过 这 样 的 改写 后 ， 我 们 可 以 认为 ， 在 test 函 数 被 调用 的 时 候 ， 生 
命 周期 参数 a 和 "mb 被 分 别 实 例 化 为 了 t 和 x。 它 们 刚好 满足 了 where 条 件 中 
的 t: 约束。 而 &arg.member 这 条 表达 式 的 类 型 是 &'ti32， 返 回 值 要 求 


的 是 &x i32 类 型 ， 可 见 这 也 是 合法 的 。 所 以 test 函 数 的 生命 周期 检查 可 


上 述 示例 是 读者 比较 难 理解 的 地 方 。 以 下 两 种 写法 都 是 可 行 的 : 





fn test<'a>(arg: &'a T) -> &'a i32 
fn test<'a, 'b>(arg: &'a T) -> &'b i32 where 'a:'b 





这 里 的 关键 是 ，Rust 的 引用 类 型 是 支持 协 变 ” 的 。 在 编译 器 眼 里 ， 
生命 周期 束 是 一 个 区 间 ， 生 命 周 期 参数 就 是 一 个 普通 的 泛 型 参数 ， 它 可 
以 被 特 化 为 某 个 具体 的 生命 周期 。 


我 们 再 看 一 个 例子 。 它 有 两 个 引用 参数 ， 共 至 同一 个 生命 周期 标 
| 





fn Select<'a>(arg1: &'a i32, arg2: &'a i32) -> &'a i32 { 
If *arg1 > *arg2 { 
arg1 
} else { 
arg2 
} 
} 


fn main() { 
let x = 1; 
let y = 2,; 
let selected = select(&x, &y); 
println!("{}", selected); 
} 








上 述 示例 中 ，select 这 个 函数 引入 了 一 个 生命 周期 标记 ， 两 个 参数 
以 及 返回 值 都 是 用 的 这 个 生命 周期 标记 。 同 时 我 们 注意 到 ， 在 调用 的 时 
候 ， 传递 的 实 参 其 实 是 具备 不 同 的 生命 周期 的 。 x 的 生命 周期 明显 大 于 y 
的 生命 周期 ，&x 可 存活 的 范围 要 大 于 &y 可 存活 的 范围 ， 我 们 把 它们 的 
实际 生命 周期 分 别 记录 为 X 和 'y。select 函 数 的 形式 参数 要 求 的 是 同样 的 
生命 周期 ， 而 实际 参数 是 两 个 不 同 生 命 周 期 的 引用 ， 这 个 类 型 之 所 以 可 
以 匹配 成 功 ， 就 是 因为 生命 周期 的 协 变 特性 。 
生命 周期 都 缩小 到 茶 个 生命 周期 a 以 内 ， 且 满足 x: 'a，Yy: 返回 的 
selected 变 量具 备 'a 生 命 也 并 没有 超过 x 和 wy 的 范围 。 所 以 ， 最 终 
的 生命 周期 检查 可 以 通 








12.4.2 ”类 型 的 生命 周期 标记 








如 果 目 定义 类 型 中 有 成 员 包含 生命 周期 参数 ， 那 么 这 个 目 定 义 类 型 
也 必须 有 生命 周期 参数 。 示 例如 下 : 





struct Test<'a> { 
member: &'a str 


} 





在 使 用 impl 的 时 候 ， 也 需要 先 声明 再 使 用 : 





impl<'t> Test<'t> { 
fn test<'a>(&self, s: &'a str) { 


} 
} 





impl 后 面 的 那个 是 用 于 声明 生命 周期 参数 的 ， 后 面 的 Test<'t> 是 在 


这 个 参数 。 如 果 有 必要 的 话 ， 方 法 中 还 能 继续 引入 新 的 泛 型 


如 果 在 泛 型 约束 中 有 where T: 'a 之 类 的 条 件 ， 其 意思 是 ， 类 型 T 的 
ac 要 特别 说 明 的 是 ， 奉 是 有 where 
T: 0 意思 则 是 ， 0 8 周期 的 
i 思 是 要 么 完全 不 包含 任何 借用 ， 要 么 可 以 有 指 问 'static 的 
日 











12.5 ”省略 生 命 周 期 标记 


在 茶 些 情况 下 ，Rust 允 许 我 们 在 写 函 数 的 时 候 省 略 掉 显 式 生命 周期 
标记 。 在 这 种 时 候 ， 编 译 器 会 通过 一 定 的 固定 规则 为 参数 和 返回 值 指定 
合适 的 生命 周期 ， 从 而 省 略 一 些 显而易见 的 生命 周期 标记 。 比 如 我 们 可 
以 写 这 样 的 代码 : 








fn get_str(s: &String) -> &str { 
s.as_ref() 








实际 上 ， 它 等 同 于 下 面 这 样 的 代码 ， 只 是 把 显 式 的 生命 周期 标记 省 
略 把 了 而 已: 





fn get_str<'a>(s: &'a String) -> &'a str { 
s.as_ref() 


} 





各 把 以 上 代码 稍微 修改 一 下 ， 返 回 的 指针 将 并 不 指 同 参数 传 入 的 数 
据 ， 而 是 指 问 一 个 静态 第 量 ， 代 码 如 下 : 








fn get_str(s: &String) -> &str { 
println!i("call fn {}", s); 
"hello world" 

} 





这 时 ， 我 们 期 望 返 回 的 指针 实际 上 是 &'static str 类 型 。 测 试 代 码 如 
下 : 





fn main() { 
let c = String::from("haha"); 
let x: &'static str = get_str(&c); 
println!i("{}", x); 





可 以 看 到 ， 在 get_str 函 数 中 ， 返 回 的 是 一 个 指 癌 静态 字符 串 的 指 
针 。 在 主 函数 的 调用 方 ， 我 们 希望 变量 x 指 疝 一 个 “静态 变量 *”。 可 是 这 








一 次 ， 我 们 发 现 了 编译 错误 : 





error: ‘cc does not live long enough 

















按照 分 析 ， 变 量 x 理 应 指向 一 个 'static 生 命 周 期 的 变量 ， 根 本 不 是 指 
癌 C 变 量 ， 它 的 存活 时 间 足 够 长 ， 为 什么 编译 器 没 发 现 这 一 点 呢 ? 这 是 
因为 ， 编 译 器 对 于 省 略 掉 的 生命 周期 ， 不 是 用 的 “ 目 动 推理 ”策略 ， 而 是 
用 的 几 个 非常 简单 的 “固定 规则 ”策略 。 这 跟 类 型 自动 推导 不 一 样 ， 当 我 
们 省 略 变 量 的 类 型 时 ， 编 译 器 会 试图 通过 变量 的 使 用 方式 推导 出 变量 的 
类 型 ， 这 个 过 程 叫 "type inference”。 8 周期 参数 ， 编 
译 右 的 处 理 方 式 就 简单 粗暴 得 多 ， 它 完全 不 管 函 数 内 部 的 实现 ， 并 不 笠 
试 找到 最 合适 的 推理 方案 ， 只 是 点 用 几 个 固定 的 规则 而 已 这 些 规则 被 
称 为 "lifetime elision rules”。 以 下 就 是 省 略 的 生命 周期 被 目 动 补 全 的 规 
则 : 

















次 带 生 命 周 期 参数 的 输入 参数 ， 每 个 对 应 不 同 的 生命 周期 参 


-如 条 只 有 一 个 输入 参数 带 生 命 周期 参数 ， 那 么 返回 值 的 生命 周期 
被 指定 为 这 个 参数 ， 


-如 采 有 多 个 输入 参数 市 生命 周期 参数 ， 但 其 中 有 &self、&mut 
self， 那 么 返回 值 的 生命 周期 被 指定 为 这 个 参数 ; 


-以 上 都 不 满足 ， 融 不 能 目 动 补 全 返回 值 的 生命 周期 参数 。 
这 时 再 回头 去 看 前 面 的 例子 ， 可 以 知道 ， 对 于 这 个 函数 : 





fn get_str(s: &String) -> &str { 
println!i("call fn {}", s); 
"hello world" 

} 





编译 絮 会 目 动 补 全 生命 周期 参数 : 





fn get_str<'a>(s: &'a String) -> &'a str { 
prant ln 'call fn {}", Ss); 
"hello world" 





所 以 ， 当 我 们 调用 





Jet x: &'static str = get_str(&c) 








这 句 代码 的 时 候 ， 就 发 生 了 编译 错误 。 了 解 了 这 些 ， 修 复方 案 也 就 
很 简单 了 。 在 这 种 情况 下 ， 我 们 不 能 省 略 生命 周期 参数 ， 让 编译 器 给 我 
们 目 动 补 全 ， 目 己 手写 就 对 了 : 





fn get_str<'a>(s: &'a String) -> &'static str { 
println!i("call fn {}", Ss); 
"hello world" 

} 





或 者 只 手写 返回 值 的 生命 周期 参数 ， 输 入 参数 靠 编 译 器 目 动 补 全 : 





fn get_str(s: &String) -> &'static str { ... } 





最 后 ， 一 句 话 总 结 ，elision! =inference， 省 略 生命 周期 参数 和 类 型 
自动 推导 的 原理 是 完全 不 同 的 。 





第 13 草 ”信用 检 碍 


在 前 文中 ， 我 们 已 经 讨论 了 Rust 在 内 存 管理 方面 的 语法 。 本 文 将 主 
要 探讨 Rust 实 现 无 性 能 损失 的 “内存 安全 ”的 原理 。 


Rust 语 言 的 核心 特点 是 :在 没有 放弃 对 内 存 的 下 接 控 制 力 的 情况 
下 ， 实 现 了 内 存 安 全 。 所 谓 对 内 存 的 且 接 控制 能 力 ， 前 文 已 经 有 所 展 
示 : 可 以 目 行 决定 内 存 布局 ， 包 括 在 栈 上 分 配 内 存 ， 还 是 在 堆 上 分 配 内 
存 ; 文 持 指针 类 型 ， 可 以 对 一 个 变量 实施 取 地 址 操作 ;， 有 确定 性 的 内 存 


释放 ;等 等 。 


为 一 方面 ， 从 安全 性 的 角度 来 说 ， 我 们 可 以 看 到 ，Rust 有 所 有 权 概 
念 、 借 用 指针 、 生 命 周 期 分 析 等 这 些 内 容 。 初 学 者 在 刚 开始 碰 到 这 些 概 
念 的 时 候 ， 往 往 会 觉得 无 所 适 从 ， 感 觉 太 麻烦 、 太 复 洒 了 。 随 便 写 个 小 
程序 都 编译 不 通过 ， 学 习 曲 线 非 常 陡峭 。 那 么 ，Rust 设 计 者 完 疯 是 如 何 
考虑 的 这 个 问题 ， 为 什么 要 设计 这 样 复 杂 的 规则 ? Rust 语 言 的 这 一 系列 
安全 规则 ， 背 后 的 指导 思想 完 竟 是 什么 呢 ? 


忆 的 来 说 ，Rust 的 设计 者 们 在 一 系列 的 “内 存 不 安全 ”的 问题 中 观察 
到 了 这 样 的 一 个 结论 : 

















Danger arises from Aliasing+Mutation 

首先 我 们 介绍 一 下 这 两 个 概念 Alias 和 Mutation 。 

(1) Alias 的 意思 是 “别名 >”。 如 果 一 个 变量 可 以 通过 多 种 Path 来 访 
问 ， 那 它们 就 可 以 互相 看 作 alias。Alias 意 味 着 “共享 ”， 我 们 可 以 通过 多 
个 入 口 访问 同一 块 内 存 。 


(2) Mutation 的 意思 是 “改变 ”"。 如 果 我 们 通过 某 个 变量 修改 了 一 块 
内 存 ， 就 是 发 生 了 mutation。Mautation 意 味 着 拥有 “修改 ”权限 ， 我 们 可 以 
写 入 数据 。 


Rust 保 证 内 存 安全 的 一 个 重要 原则 就 是 ， 如 果 能 保证 alias 和 
mutation 不 同时 出 现 ， 那 么 代码 就 一 定 是 安全 的 。 


在 本 书 中 ， 笔 者 将 此 规则 总 结 为 : 共享 不 可 变 ， 可 变 不 共 圣 。 
































13.1 编译 错误 示例 


Rust 的 编译 错误 列表 (https://doc.rust-lang.org/error-index.html ) 
中 ， 从 E0499 到 E0509， 所 有 的 这 些 编译 错误 ， 其 实 都 在 讲 同 一 件 事 
情 。 它 们 主要 关心 的 是 共享 和 可 变 之 间 的 关系 。"“ 共 享 不 可 变 ， 可 变 不 
共享 ”是 所 有 这 些 编译 错误 遵循 的 同样 的 法 则 。 


下 面 我 们 通过 几 个 简单 的 示例 来 直观 地 感受 一 下 这 个 规则 究竟 是 什 

















fn main() { 
let i = 0; 
let pi = & LI 
let p2 = & LI 
println!("{} {} {}", i, pi, p2); 





以 上 这 段 代 码 是 可 以 编译 通过 的 。 其 中 变量 绑 定 i、p1、p2 指 回 的 
是 同一 个 变量 ， 我 们 可 以 通过 不 同 的 Path 访 问 同一 块 内 存 p，*p1， 
*p2， 所 以 它们 存在 “共享 >”。 而 且 它 们 都 只 有 只 读 的 权限 ， 所 以 它们 存 
在 “共享 "”， 不 存在 “可 变 ”"。 因 此 它 一 定 是 安全 的 。 





示例 二 


和 然后 在 存在 pl 的 情况 下 ， 通 过 i 修 改变 
量 的 值 : 











fn main() { 
let mut i = 0，; 
let pi = & LI 
ee 


} 





编译 ， 出 现 了 错误 ， 错 误 信 息 为 : 





error: cannot assign to ‘i because it is borrowed [E0506] 





这 个 错误 可 以 这 样 理 解 : 在 存在 只 读 借 用 的 情况 下 ， 变 量 绑 定 i 和 
p1 已 经 互 为 alias， 它 们 之 间 存 在 “共享 ”， 因 此 必须 避免 “可 变 ”。 这 上段 代 
人 码 违 反 了 “共享 不 可 变 ” 的 原则 。 


示例 三 


如 采 我 们 把 上 例 中 的 借用 改 为 可 变 借用 的 话 ， 其 实 是 可 以 通过 和 它 修 
改 原 来 变量 的 值 的 。 以 下 代码 可 以 编译 通过 : 











fn main() { 
let mut i = 0，; 
let pi = &mut i; 
“pl = 1; 

} 








那 我 们 是 不 是 说 ， 它 违反 了 “ 共 侍 不 可 变 ” 的 原则 呢 ? 其 实 不 是 。 因 
为 这 段 代 码 中 不 存在 “共享 "。 在 可 变 借用 存在 的 时 候 ， 编 译 占 认为 原来 
的 变量 绑 定 i 已 经 被 冻结 (frozen〉， 不 可 通过 i 读 写 变量 。 此 时 有 且 仪 有 
pl 这 一 个 入 口 可 以 读 写 变量 。 证 明 如 下 : 

















fn main() { 
Jet mut i = 0，; 
let pi = &mut i; 
“pl = 1; 
let x = i; // 通过 i 读 变 量 

















} 





在 存在 p1 的 情况 下 ， 我 们 再 通过 i 做 读 操 作 是 错误 的 : 





error: cannot use ‘i because it was mutably borrowed [E0503] 





同 理 ， 如 有 我 们 改 成 下 面 这 样 ， 一 样 会 出 错 : 





fn main() { 
let mut i = 0，; 
let pi = &mut i; 
i = 1; // 通过 i 写 变 量 


} 























在 p1 存 在 的 情况 下 ， 不 可 通过 i 写 变量 。 如 果 这 种 情况 可 以 被 允 
许 ， 那 就 会 出 现 多 个 入 口 可 以 同时 访问 同一 块 内 存 ， 且 都 具有 写 权 限 ， 
这 就 违反 了 Rnust 的 “共享 不 可 变 ， 可 变 不 共 孚 ”的 原则 。 错 误 信 息 为 : 




















error: cannot assign to ‘i because it is borrowed [E0506] 





示例 四 
同时 创建 两 个 可 变 借 用 的 情况 : 





fn main() { 
Jet mut i = 0，; 
let pi = &mut i; 
let p2 = &mut i; 
} 





编译 错误 言 息 为 : 





error: cannot borrow ‘i as mutable more than once at a time [E0499] 





因为 pI、p2 痢 是 可 变价 用， 它们 都 指向 了 同一 个 变量 ， 而 且 都 有 修 
改 权 限 ， 这 是 Rust 不 允许 的 情况 ， 因 此 这 段 代 码 无 法 编译 通过 。 


正 因 如 此 ，&mnut 型 借用 也 经 名 被 称 为 “独占 指针 ”， 区 型 借用 也 经 党 
被 称 为 “共享 指针 ?”。 


13.2 ”内 存 不 安全 示例 : 修改 枚 举 


Rust 设 计 的 这 个 原则 ， 究 竟 有 没有 必要 呢 ? 它 又 是 如 何在 实际 代码 
中 起 到 “内 存 安全 ”检查 作用 的 呢 ? 


第 一 个 示例 ， 我 们 用 enum 来 说 明 。 假 如 我 们 有 一 个 枚 举 类 型 : 








enum StringOrInt { 
str(String), 
Int(i64), 

} 





它 有 两 个 元 素 ， 分 别 可 以 携带 String 类 型 的 信息 以 及 i64 类 型 的 信 
晨 。 假 如 我 们 有 一 个 引用 指向 了 它 的 内 部 数据 ， 同 时 再 修改 这 个 变量 ， 
大 家 猜想 会 及 生 什 么 情况 ? 这 样 做 可 能 会 出 现 内 存 安全 问题 ， 因 为 我 们 
有 机 会 用 一 个 String 类 型 的 指针 指向 i64 类 型 的 数据 ， 或 者 用 一 个 i64 类 型 
的 指针 指 辣 String 类 型 的 数据 。 完 整 示 例如 下 : 





use std::fmt::Debug; 


#[derive(Debug)] 

enum StringorInt { 
Str(String)， 
Int(i64), 

} 


fn main() { 
Use StringOrInt::{Str, Int}; 
let mut x = Str("Hello world".to_string()); 


If let Str(ref insides) =x{ 
x = Int(1)， 
println!("inside is {}, x says: {:?}", insides, x); 





在 这 段 代 码 中 ， 我 们 用 if let 语 法 创建 了 一 个 指向 内 部 String 的 指 
针 ， 然 后 在 此 指针 的 生命 周期 内 ， 再 把 x 内 部 数据 变 成 164 类 型 。 这 是 典 
型 的 内 存 不 安全 的 场景 。 


笠 运 的 是 ， 这 段 代 码 编译 不 通过 ， 错 误 信 息 为 : 








error: cannot assign to ‘x because it is borrowed [E0506] 





这 个 例子 给 了 我 们 一 个 直观 的 感受 ， 为 什么 Rust 需 要 “可 变性 和 共 
译 性 不 能 同时 存在 ”的 规则 ? 保证 当前 只 有 一 个 访问 入 口 ， 这 是 保证 安 
全 的 可 靠 做 法 。 


13.3 ”内 存 不 安全 示例 : 迭代 器 失效 


如 果 在 人 表 历 一 个 数据 结构 的 过 程 中 修改 这 个 数据 结构 ， 会 导致 迭代 
器 失效 。 比 如 在 C++ 里 面 ， 我 们 可 能 写 出 这 样 的 代码 : 








#include <vector> 


using namespace std; 
int main() 
vector<int> v(10, 10); 


for (vector<int>::iterator i = Vv.begin(); i != v.end(); i++) { 
if (*i % 2 == 0) { // when arbitrary condition satisfied 
v.clear(); 
} 
return 0©; 





编译 ， 执 行 ， 发 现 程序 崩 尝 了。 原因 就 在 于 我 们 在 迭代 的 过 程 中 ， 
数组 v 直 接 被 清空 了 ， 而 迭代 器 并 不 知道 这 个 信息 ， 它 还 在 继续 进行 从 
代 ， 于 是 出 现 了 “时 指针 ”现象 ， 此 时 迭代 器 实际 上 指向 了 已 经 被 释放 的 
内 存 。 迭 代 器 失效 这 样 的 问题 在 C++ 中 是 “未 定义 行为 ”， 也 就 是 说 可 能 
发 生 什 么 后 果 都 是 未 知 的 。 这 是 一 种 典型 的 内 存 不 安全 行为 。 


然而 ， 在 Rust 里 面 ， 下 面 这 样 的 代码 是 不 允许 编译 通过 的 : 








fn main() { 
Jet mut arr = vec!["ABC", "DEF", "GHI"]; 
for item In &arr { 
arr.clear(); 
} 


} 





为 什么 Rust 可 以 避免 这 个 问题 呢 ? 因为 Rust 里 面 的 for 循 环 实 质 上 是 
生成 了 一 个 欠 代 器 ， 它 一 直 持 有 一 个 指 癌 容 堪 的 引用 ， 在 友 代 器 的 生命 
周期 内 ， 任 何 对 容器 的 修改 都 是 无 法 编译 通过 的 。 类 似 这 样 : 





{  ”// 以 下 是 伪 代 码 
// 在 iter 变 量 的 生命 周期 内 , 它 都 持 有 一 个 指向 arr 的 引用 


let iter<'a> = into_iter(&'a arr); 












































loop 荆 
match iter.next() { 
// 如 果 需 要 使 用 arr 的 &mut 指针 , 则 会 发 生 冲 突 



































// &mut arr 和 &arr 不 能 同时 存在 , 它 违反 了 Rust 内 存 安全 的 原则 
Some(i) => { arr.clear(); } 
None => break ， 
} 
} 
} 








在 整个 for 循 环 的 范围 内 ， 这 个 迭代 器 的 生命 周期 都 一 直 存 在 。 而 它 
持 有 一 个 指 回 容器 的 引用 ，&& 型 或 者 &mut 型 ， 根 据 情况 而 定 。 达 代 器 的 
API 设 计 是 可 以 修改 当前 指 问 的 元 素 ， 没 办 法 修改 容器 本 里 的 。 当 我 们 
想 在 这 里 对 容器 进行 修改 的 时 候 ， 必 然 需 要 产生 一 个 新 的 针对 容器 的 
&mut 型 引用 ， 《clear 方 法 的 签名 是 Vec: : clear (&mut self) ， 调 用 
clear 必 然 产生 对 原 Vec 的 &mut 型 引用 ) 。 这 是 与 Rust 
的 “aliastmutation” 规 则 相 冲 突 的 ， 所 以 编译 不 通过 。 


为 什么 在 Rust 中 永远 不 会 出 现 迭 代 右 失效 这 样 的 错误 ?因为 通 
过 “mutation+alias” 规 则 ， 就 可 以 完全 杜绝 这 样 的 现象 ， 这 个 规则 是 Rust 
内 存 安全 的 根 ， 是 解决 内 存 安 全 问题 的 灵魂 。Rust 不 是 针对 各 式 各 样 的 
场景 ， 用 case by case 的 方式 来 解决 内 存 安全 问题 。 而 是 通过 一 种 统一 的 
机 制 ， 高 屋 建 领地 解决 这 一 类 问题 ， 快 刀 斩 乱 且 ， 直 击 要 害 。 


面 对 类 似 迭 代 器 失效 这 一 类 的 、 指 针 指 向 非法 地 址 的 内 存 安全 问 
题 ， 许 多 语言 都 无 法 做 到 静态 检查 出 来 。 比 如 在 Java 中 出 现 这 样 的 问题 
的 时 候 ， 编 译 器 是 没 法 检查 出 来 的 ， 在 执行 阶段 ， 程 序 会 抛 出 一 个 异 
贡 “Exception in thread“main”java.util.ConcurrentModificationException”。 
因为 我 们 在 for 循 环 内 部 对 容器 本 喘 做 了 修改 ，Java 容 堪 探 测 到 了 这 种 修 
改 ， 然 后 就 阻止 了 逻辑 的 继续 执行 ， 抛 出 了 腊 音 。Java 的 这 个 设计 相 比 
C++ 要 好 很 多 ， 因 为 即便 出 现 了 迭代 磺 失 效 ， 最 多 引发 异常 ， 而 并 不 会 
有 “时 指针 ”这 样 的 内 存 安全 问题 ， 因 为 迭代 器 没有 机 会 访问 已 经 被 释放 
的 非法 内 存 。 然 而 “ 抛 出 异常 ?并 不 是 一 个 完美 的 设计 ， 只 是 不 得 已 而 为 
之 罢了 。 因 为 异常 本 来 的 设计 目的 是 为 了 处 理 外 部 环境 难以 预计 的 错误 
的 ， 而 现在 的 这 个 错误 实际 上 是 程序 的 逻辑 错误 ， 即 便 抛 出 了 卉 常 ， 外 
部 逻辑 捕获 了 这 个 异常 ， 也 没什么 好 办 法 来 处 理 。 唯 一 合理 的 修复 方案 
是 ， 发 现 这 样 的 异 镶 之 后 ， 回 过 头 来 修复 代码 错误 。 这 样 的 问题 如 宋 在 
编译 阶段 就 能 得 到 发 现 和 解决 ， 才 是 最 合适 的 解决 方案 。 在 吉 历 容 桌 的 
时 候 同时 对 容 右 做 修改 ， 可 能 出 现在 多 线程 场景 ， 也 可 能 出 现在 单线 程 


场景 。 








类 似 这 样 的 问题 依靠 GC 也 没 办 法 处 理 。GC 只 关心 内 存 的 分 配 和 各 
放 ， 对 于 变量 的 读 写 权限 是 不 关心 的 。GC 在 此 处 发 挥 不 了 什么 作用 。 


而 Rust 依 靠 我 们 前 面 强调 的 “alias+mutation” 规 则 就 可 以 很 好 地 解决 
该 问题 。 这 个 思路 的 核心 就 是 ， 如果 存 在 多 个 只 读 的 引用 ， 是 允许 的 ; 
如 果 存 在 可 写 的 引用 ， 那 么 整 一 定 不 能 同时 存在 其 他 的 只 读 或 者 可 写 的 
引用 。 大 家 看 到 这 个 逻辑 ， 是 不 是 马上 联想 到 多 线程 环境 下 
的 “ReadWriteLocker”? 事实 也 确实 如 此 。Rust 检 查 内 存 安 全 的 核心 逻辑 
可 以 理解 为 一 个 在 编译 阶段 执行 的 读 写 锁 。 多 个 读 同 时 存在 是 可 以 的 ， 
存在 一 个 写 的 时 候 ， 其 他 的 读 写 都 不 能 同时 存在 。 


大 家 还 记 不 记得 ，Rust 设 计 者 总 结 的 Rust 的 三 大 特点 : 一 是 快 ， 二 
是 内 存 安 全 ， 三 是 免除 数据 竞争 。 由 上 面 的 分 析 可 见 ，Rust 所 说 的 “ 免 
除数 据 竞 争 ”， 实 际 上 和 “内 存 安全 ”是 一 回 事 。 “免除 数据 竞争 ”可 以 看 
作 多 线程 环境 下 的 “内 存 安全 ”。 单 线程 环境 下 的 “内 存 安全 ” 靠 的 是 编译 
阶段 的 类 似 读 写 锁 的 机 制 ， 与 多 线程 环境 下 其 他 语言 第 用 的 读 写 锁 机 制 
并 无 太 大 区 别 。 也 正 因为 Rust 编 译 堪 在 设计 上 打下 的 恨 好 基础 , “内 存 
安全 ?才能 轻松 地 扩展 到 多 线程 环境 下 的 “免除 数据 竞争 ”。 这 两 个 概念 
其 实 只 有 一 箭 之 隔 。 所 以 我 们 可 以 理解 Java 将 此 异 浓 命名 
为 “Concurrent” 的 真实 含 》 这 里 的 “Concurrent” 并 不 是 单 指 多 线程 并 
发 。 


























13.4 内存 不 安全 示例 : 巧 空 指 针 


我 们 再 使 用 一 个 例子 ， 来 继续 说 明 为 什么 Rust 的 “mnutation+alias” 规 
则 是 有 必要 的 。 我 们 这 次 通过 制造 一 个 悬空 指针 来 解释 。 以 下 为 一 段 合 
理 的 C++ 代码 ， 它 创建 了 一 个 动态 数组 ， 然 后 使 用 了 一 个 指针 ， 指 向 了 
动态 数组 的 内 部 元 素 ， 然 后 我 们 同 动 态 数组 内 添加 内 容 ， 然 后 发 现 原先 
的 指针 “有 甚 空 ”» 了 ， 它 指向 了 一 个 非法 的 地 址 : 








// 以 下 仅仅 为 了 示例 而 已 , 不 代表 推荐 的 C++ 编码 风格 
#include <vector> 
#include <iostream> 


using namespace std; 
int main() { 
vector<int> v(100, 5); 


// 指针 指向 内 部 第 一 个 元 素 

int * pO = &v[0]; 

cout << *p0 << endl; 

// 为 了 确保 v 发 生 扩容 ,多 插入 一 些 数 据 

for (int i = 0; i<100; I++) { 
Vv.push_back(10); 








} 

// 打印 p9 的 内 容 

cout << *pg << end]; 
return ©; 





编译 通过 ， 执 行 结果 为 : 
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熟悉 STL 的 朋友 肯定 知道 这 里 究竟 发 生 了 什么 。 动 态 数组 是 自行 管 
理 内 存 空间 的 ， 在 向 动态 数组 内 部 添加 元 素 的 时 候 ， 如 果 超 过 了 当前 的 
最 大 容量 ， 这 个 动态 数组 会 申请 一 块 更 大 的 连续 内 存 空间 ， 将 原来 的 元 
素 移动 过 去 ， 释 放 掉 之 前 的 内 存 空间 ， 然 后 继续 往 后 面 添加 元 素 。 


我 们 的 指针 一 开始 是 指向 动态 数组 的 第 一 个 元 素 的 ， 但 是 当 往 动态 
数组 内 部 添加 多 个 元 系 之 后 ， 之 前 的 那 块 内 存 已 经 不 够 用 了 ， 动 态 数 组 
在 这 个 过 程 中 已 经 将 原来 的 内 存 空间 释放 ， 并 申请 了 新 的 内 存 空间 。 于 











是 ， 原 本 应 该 指向 数组 第 一 个 元 素 的 指针 从 一 个 合法 的 指针 变 成 了 指 癌 
己 回 收 内 存 区 域 的 上 空 指针 ， 它 现在 指向 的 数据 是 与 原来 的 意图 不 同 
的 。 而 这 种 情况 正 是 属于 Rust 希 望 解决 的 “内 存 安全 ”问题 。 


我 们 来 看 看 用 Rust 写 会 发 生 什 么 。 同 样 ， 使 用 动态 数组 类 型 ， 使 用 
一 个 指针 指向 它 的 第 一 个 元 系 ， 然 后 在 原来 的 动态 数组 中 插入 数据 : 

















fn main() { 
Jet mut arr : Vec<i32> = vec![1,2,3,4,5]; 
let p : &i32 = &arr[0]; 
for i in 1..100 { 
arr.push(i); 





编译 不 通过 ， 错误 信息 为 : 


error: cannot borrow ‘arr. as mutable because it is also borrowed as immutable 


我 们 可 以 看 到 , “mnutation+alias” 规 则 再 次 起 了 作用 。 在 存在 一 个 不 
可 变 引 用 的 情况 下 ， 我 们 不 能 修改 原来 变量 的 值 。 写 Rust 代 码 的 时 候 ， 
经 常会 有 这 样 的 感觉 ，Rust 编 译 器 极其 严格 ， 甚 至 到 了 “不 近 人 情 ” 的 地 
步 。 但 是 大 部 分 时 候 却 又 发 现 ， 它 指出 来 的 问题 的 确 是 对 我 们 编程 有 益 
的 。 对 它 使 用 越 熟 练 ， 越 觉得 它 是 一 个 好 帮手 。 


13 小 全 














Rust 在 内 存 安全 方面 的 设计 方案 的 核心 思想 是 “共享 不 可 变 ， 可 变 
不 共享 ”。 


在 可 变性 控制 方面 ， 如 果 说 ，C 语 言 和 函数 式 编程 语言 分 属 一 个 天 
平 的 两 端 ， 那 么 Rust 束 处 于 这 个 天 平 的 中 央 。 C 语 言 的 思想 是 ; 尽量 不 
对 程序 员 做 限制 ， 尺 量 接 近 机 器 拘 层 ， 类 型 安全 、 可 变性 、 共 享 性 都 由 
程序 员 上 自由 和 擎 控 ， 语 言 本 身 不 提供 太 多 的 限制 和 规定 。 安 全 与 个 ， 也 完 
全 取决 于 程序 员 。 而 函数 式 编 程 的 思想 是 : 尽量 使 用 不 可 变 绑 定 ， 在 可 
变性 上 有 严格 限制 ， 在 共享 性 方面 没有 限制 。 函 数 式 编程 特别 强调 无 副 
作用 的 函数 以 及 不 可 变 类 型 ， 以 此 来 达到 提高 安全 性 的 目的 。 


而 Rust 则 是 选择 了 折 中 的 方案 ， 既 允许 可 变性 ， 也 人 允许 共享 性 ， 只 
要 这 两 者 不 是 同时 出 现 即 可 。“ 共 至 不 可 变 ， 可 变 不 共享 "，” 是 Rust 保 证 
内 存 安全 和 线程 安全 的 “法 宝 ”。 而 我 们 可 以 看 到 ，Rust 的 这 个 设计 并 不 
是 首 鼠 两 应 、 和 丢 泥 式 的 中 庸 之 道 ， 而 是 经 过 了 仔细 的 观察 总 结 、 严 鹿 
的 设计 之 后 的 产物 。 


， 相 比 函 数 式 设计 方式 ，Rust 并 没有 本 质 上 牺牲 安全 性 。 函 数 
人 极 大 地 提升 了 安全 性 的 同时 ， 也 极 大 地 提 
高 了 学 习 门 槛 。 而 Rust 在 “不 可 变 ” 要 求 上 的 理性 妥协 ， 实 现 了 在 不 损失 
安全 性 的 同时 ， 一 定 程度 上 也 降低 了 学 习 成 本 。 从 C/C++ 背景 转 为 使 用 
Rust 无 需 做 太 大 的 思维 转变 。 相 比 函 数 式 的 设计 方式 ，Rust 的 入 门 门槛 
更 低 。 虽 然 对 于 习惯 了 无 拘 无 束 自由 挥洒 的 C/C++ 编 程 语言 的 朋友 来 
说 ， 还 是 有 诸多 不 习惯 ， 但 毕竟 比 Haskell 要 容易 得 多 。 


其 二 ，Rust 针 对 传统 C/C++ 做 了 大 幅 改 进 ， 设 计 了 一 系列 静态 检查 
规则 ， 来 防止 一 些 潜在 的 bug。“ 共 至 不 可 变 ， 可 变 不 共 至 ”就 是 其 中 一 
项 重要 的 规则 。 在 传统 的 C/C++ 中 ， 所 有 的 指针 都 是 同一 个 类 型 。 从 功 
能 性 来 说 ， 这 样 设计 是 非常 强大 的 ， 但 它 缺 少 的 恰恰 是 一 定 程度 的 取 
舍 ， 以 提高 安全 性 。 相 对 来 说 ，Rust 对 程序 员 的 限制 更 多 ， 有 所 为 、 有 
所 不 为 。 惑 励 用 户 使 用 的 功能 应 当 越 容易 越 优雅 越 好 ， 避 免 用户 滥 用 的 
功能 应 当 越 困难 越 复杂 越 好 。 二 者 不 可 偏 废 。 


其 三 ，Rust 的 这 套 内 存 安全 体系 ， 不 需要 依赖 GC。 里 然 现在 GC 的 
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性 能 越 来 越 好 ， 但 是 没有 GC 在 东 些 场景 下 依然 是 很 重要 的 。 没 有 GC、 

编译 型 语言 的 特点 ， 是 Rust 执 行 性 能 的 潜力 保证 。 这 就 是 为 什么 Rust 设 
计 组 有 底气 说 Rust 的 运行 性 能 与 C 语 言 处 于 同一 个 档次 的 原因 。 当 然 ， 

目前 的 Rust 还 很 年 轻 ， 许 多 优化 还 没有 实现 ， 但 这 不 要 紧 ， 单 从 技术 层 
面 上 看 ， 还 有 许多 优化 在 可 行 性 上 是 没 问 题 的 ， 唯 一 需要 的 是 时 间 和 工 
作 量 。 另 外， 没有 GC 就 可 以 使 得 它 只 依赖 一 个 非常 轻 量 级 的 runtime。 

理论 上 来 说 ， 它 可 以 用 于 许多 藤 入 式 平 台 ， 甚 全 可 以 在 无 操作 系统 的 裸 
机 上 执行 ， 使 用 Rust 编 写 操作 系统 也 是 完全 可 行 的 。 这 就 使 得 Rust 拥 有 
与 C/C++ 相似 的 系统 级 编程 特性 ， 大 幅 扩 展 了 Rust 的 应 用 场景 。 


其 四 ，Rust 的 核心 思想 “共享 不 可 变 ， 可 变 不 共享 ”， 具 有 极 好 的 一 
致 性 和 扩展 性 。 它 不 仅 可 以 解决 内 存 安全 的 问题 ， 还 是 解决 线程 安全 的 
基础 。 在 后 文中 我 们 会 看 到 ， 所 谓 的 线程 安全 ， 实 质 上 就 是 内 存 安全 在 
多 线程 情况 下 的 上 自然 延伸 。 反 过 来 ， 我 们 也 可 以 把 Rust 的 内 存 安全 解决 
方案 视 为 传统 的 线程 安全 机 制 Read Write Locker 的 编译 阶段 执行 的 版 
本 。 大 家 应 该 都 能 联想 到 ， 在 多 线程 环境 下 ， 数 据 竞争 问题 是 怎么 出 现 
的 。 如 果 多 个 线程 对 同一 个 共享 变量 都 是 只 读 的 ， 它 是 安全 的 ; 如 果 有 
一 个 线程 对 共享 变量 写 操 作 ， 那 它 束 必须 是 独占 的 ， 不 可 有 其 他 线程 继 
续 读 写 ， 人 否则 就 会 出 现 数据 竞争 。 在 第 四 部 分 中 我 们 还 会 发 现 ，Rust 里 
0 
对 称 性 。 


由 此 我 们 可 以 看 出 ，Rust 的 这 套 设计 方案 的 确 是 有 创新 性 的 。 它 走 
出 了 一 条 前 无 古人 的 直路。Rust 在 其 他 方面 的 功能 ， 都 不 能 被 称 作 原创 
设计 ， 都 是 从 其 他 编程 语言 中 学 过 来 的 。 唯 独 安全 性 方面 的 设计 是 独 一 
无 二 的 。 只 要 我 们 保证 了 “共享 不 可 变 ， 可 变 不 共 吾 >， 我 们 就 可 以 保证 
人 
目 以 符 。 












































另外 ， 这 个 规定 是 人 否 是 过 于 严 奇 了 呢 ? 会 不 会 大 幅 削 弱 代 码 的 表达 
能 力 ? 后 面 我 们 还 需要 进一步 分 析 。 


第 14 章 NLL (Non-Lexical-Lifetime ) 


Rust 防 范 “ 内 存 不 安全 ”代码 的 原则 极其 清晰 明了 。 如 果 你 对 同一 块 
内 存 存在 多 个 引用 ， 就 不 要 试图 对 这 块 内 存 做 修改 ;， 如果 你 需要 对 一 块 
内 存 做 修改 ， 束 不 要 同时 保留 多 个 引用 。 只 要 保证 了 这 个 原则 ， 我 们 就 
可 以 保证 内 存 安全 。 它 在 实践 中 发 挥 了 强大 的 作用 ， 可 以 帮助 我 们 尽早 
发 现 问 题 。 这 个 原则 是 Rust 的 立 吴 之 本 、 和 生命 之 基 、 活 力 之 源 。 


这 个 原则 是 没 问 题 的 ， 但 是 ， 初 始 的 实现 版 本 有 一 个 主要 问题 ， 那 
就 是 它 让 借用 指针 的 生命 周期 规则 与 普通 对 象 的 生命 周期 规则 一 样 ， 是 
按 作用 域 来 确定 的 。 所 有 的 变量 、 借 用 的 生命 周期 就 是 从 它 的 声明 开 
始 ， 到 当前 整个 语句 块 结束 。 这 个 设计 被 称 为 Lexical Lifetime， 因 为 生 
命 周期 是 严格 和 词法 中 的 作用 域 范 围 绑 定 的 。 这 个 策略 实现 起 来 非常 简 
单 ， 但 它 可 能 过 于 保守 了 ， 某 些 情况 下 借用 的 范围 被 过 度 拉 长 了 ， 以 至 
0 
名 惟 军 。 


因此 ，Rust 核 心 组 又 决定 引入 Non Lexical Lifetime， 用 更 精细 的 手 
段 调 节 借 用 真正 起 作用 的 范围 。 这 就 是 NLL。 


注意 : 在 编写 本 书 时 ， 该 功能 在 编译 器 中 只 实现 了 一 小 部 分 。 




















14.1 ”NLL 希望 解决 的 问题 


首先 ， 我 们 来 看 儿 个 简单 的 示例 。 





use std::ascii::AsciiExt,; 


fn foo() -> Vec<char> { 


let mut data = vec!['a', 'b', 'c']; // --+ 'scope 
capitalize(&mut data[..]); // | 

ZN 'lifetime // | 
data.push('d'); // | 
data.push('e'); // | 
data.push('f'"); // | 
data // | 

// <----------------------------------------- + 

} 


fn capitalize(data: &mut [char]) { 
for c in data { 
c.make_ascii uppercase(); 


} 


fn main() { 
let v = foo(); 
println!i("{:?}", VvV); 





这 段 代码 是 没有 问题 的 。 我 们 的 关注 点 是 foo 〈) 这 个 函数 ， 它 在 
调用 capitalize 函 数 的 时 候 ， 创 建 了 一 个 临时 的 &mnut 型 引用 ， 在 它 的 调用 
结束 后 ， 这 个 临时 的 借用 就 终止 了 ， 因 此 ， 后 面 我 们 束 可 以 再 用 data 去 
修改 数据 。 注 意 ， 这 个 临时 的 &mut 引 用 存在 的 时 间 很 短 ， 函 数 调用 结 
束 ， 它 的 生命 周期 就 结束 了 。 


但 是 ， 如 宋 我 们 把 这 段 代码 稍 作 修改 ， 问 题 就 出 现 了 : 





fn foo() -> Vec<char> { 
let mut data = vec!['a', 'b', 'c']; // --+ 'scope 


let slice = &mut data[..];// <----------- + 'lifetime 
capitalize(slice); // | 
data.push('d'); //ERROR // | 
data.push('e'); //ERROR // | 
data.push('f'); //ERROR // | 
data //ERROR // | 

// <----------------------------------------- + 


在 这 段 代 码 中 ， 我 们 创建 了 一 个 临时 变量 slice， 保 存 了 一 个 指 辐 
i 然后 再 调用 capitalize 函 数 ， 就 出 问题 了。 编译 占 提 
个 人 立 : 





error[E0499]: cannot borrow ` data ”as mutable more than once at a time 














这 是 因为 ，Rust 规 定 “ 共 享 不 可 变 ， 可 变 不 共享 "， 同 时 出 现 两 个 
&mut 型 借用 是 违反 规则 的 。 在 编译 器 报错 的 地 方 ， 编 译 器 认为 slice 依 然 
存在 ， 然 而 又 使 用 data 去 调用 fn push (&mnut self，value: 工 ) 方法 ， 必 
然 义 会 产生 一 个 &mut 型 借用 ， 这 违反 了 Rust 的 原则 。 在 目前 这 个 版 本 
中 ， 如 果 我 们 要 修复 这 个 问题 ， 只 能 这 样 做 : 





fn foo() -> Vec<char> { 


let mut data = vec!['a', 'b', 'c']; // --+ 'scope 

{ 
let slice = &mut datal[l..]; // <------- + 'lifetime 
capitalize(slice),; // | 

}// < + 


data.push('d'); 
data.push('e'); 
data.push('f'"); 
data 





我 们 手动 创建 了 一 个 代码 块 ， 让 slice 在 这 个 子 代 码 块 中 创建 ， 后 面 
就 不 会 产生 生命 周期 冲突 问题 了 。 这 是 因为 ， 在 早期 的 编译 占 内 部 实现 
里 面 ， 所 有 的 变量 ， 包 括 引 用 ， 它 们 的 生命 周期 都 是 从 声明 的 地 方 开 
始 ， 到 当前 语句 块 结束 不 考虑 所 有 权 转 移 的 情况 )。 


这 样 的 实现 方式 意 味 厦 每 个 引 用 的 生 仰 周 凡 部 古 跟 代码 志 

(scope) 相关 联 的 ， 它 总 是 从 声明 的 时 候 被 创建 ， 在 退出 这 个 代码 块 
的 时 候 被 销毁 ， 因此 可 以 称 为 Lexical lifetime。 而 本 章 所 说 的 Non- 
Lexical lifetime， 意 思 就 是 取消 这 个 关联 性 ， 引 用 的 生命 周期 ， 我 们 用 
另外 的 、 更 智 9 能 的 方式 分 析 。 有 了 这 个 功能 ， 上 例 中 手动 加 入 的 代码 块 
就 不 需要 了 ， 编 译 右 应 该 能 自动 分 析出 来 ，slice 这 个 引用 在 capitalize 据 
数 调 用 后 就 再 没有 被 使 用 过 了 ， 它 的 生命 周期 完全 可 以 就 此 终止 ， 不 会 
对 程序 的 正确 性 有 任何 影响 ， 后 面 再 调用 push 方 法 修改 数据 ， 其 实 跟 前 
面 的 slice 并 没有 什么 冲突 关系 。 


看 了 了 上面 这 个 例子 ， 可 能 有 人 还 会 觉得 ， 显 式 的 用 一 个 代码 块 来 规 

















定局 部 变量 的 生命 周期 是 个 更 好 的 选择 ，Non-Lexical-Lifetime 的 意义 似 
平 并 不 大 。 那 我 们 再 继续 看 看 更 复杂 的 例子 。 我 们 可 以 友 现 ，Non- 
Lexical-Lifetime 可 以 打开 更 多 的 可 能 性 ， 让 用 户 有 机 会 用 更 直观 的 方式 
写 代码 。 比 如 下 面 这 样 的 一 个 分 支 结 构 的 程序 : 





fn process_ or_default<K,V:Default> 
(map: &mut HashMap<K,V>, key: K) 


match map.get_mut(&key) { // ------------- + 'lifetime 
Some(value) => process(value), // 
None => { // 


map. A V::default()); // 
// 入 OR. 





这 上段 代码 从 一 个 HashMap 中 查询 某 个 key 是 否 存 在 。 如 果 存 在 ， 就 
继续 处 理 ， 如 果 不 存 在 ， 就 插入 一 个 新 的 值 。 目 前 这 段 代 码 是 编译 不 过 
的 ， 因 为 编译 器 会 认为 在 调用 get_mut (&key) 的 时 候 ， 产 生 了 一 个 指 
癌 map 的 &mnut 型 引用 ， 而 且 它 的 返回 值 也 包含 了 一 个 引用 ， 返 回 值 的 生 

命 周期 是 和 参数 的 生命 周期 一 致 的 。 这 个 方法 的 返回 值 会 一 直 存 在 于 整 
ete, 吾 句 块 中 ， 所 以 编译 器 判定 ， 针 对 map 的 引用 也 是 一 直 存 在 于 整 
个 match 语 句 块 中 的 。 于 是 后 面 调用 insert 方 法 会 发 生 冲突 。 


当然 ， 如 果 我 们 从 逻辑 上 来 理解 这 段 代 码 ， 束 会 知道 ， 这 有 段 代码 其 
实 是 安全 的 。 因 为 在 None 分 文 ， 意 味 着 map 中 没有 找到 这 个 key， 在 这 
en 但 是 可 惜 ， 在 老 版 本 的 编译 
ee 过 ， 只 能 绕 一 下 。 我 们 试 一 下 做 
0 下 的 修复 : 

















fn get_default1i<'m,K,V:Default>( 
map: &'m mut HashMap<K,V>, key: K) 


-> &'m mut V 
{ 

match map.get_mut(&key) { // ------------- + 'm 

Some(value) => return value, // | 

None => { } // | 

} ZL | 

人 人 V::default()); // | 

~~~~~ ERROR (still) | 

i Ee _mut(&key).unwrap() // | 

} /LV 


实际 上 这 个 改动 依然 会 编译 失败 。 原 因 就 在 于 returmm 语 句 ，get_mnut 
时 候 对 map 的 借用 传递 给 了 Some (value) ， 在 Some 这 个 分 支 内 存在 一 
个 引用 ， 指 辣 map 的 某 个 部 分 ， 而 我 们 又 把 value 返 回 了 ， 这 意味 着 编译 
器 认为 ， 这 个 借用 从 match 开 始 一 直到 退出 这 个 函数 都 存在 。 因 此 后 面 
的 insert 调 用 依然 肥 生 了 冲突 。 接 下 来 我 们 再 做 一 次 修复 : 








fn get_default2<'m,K,V:Default>( 
map: &'m mut HashMap<K,V>， 


key: K) 
-> &'m mut V 
{ 
if map.contains(&key) { 
SD sr 'n 
return match map.get_ mut(&key) { /ZL + 'm 
Some(value) => value, // | 
None => unreachable!() // | 
> //V 
} 


// At this point, ‘map.get mut was never 

// called! (As opposed to having been called, 
// but its result no longer being in use.) 
map.insert(key, V::default()); // OK now. 
map.get_mut(&key).unwrap() 





这 次 的 区 别 在 于 ，get_mut 发 生 在 一 个 子 语句 块 中 。 在 这 种 情况 
下 ， 编 译 器 会 认为 这 个 借用 跟 放 外 面 的 代码 没什么 关系 。 通 过 这 种 方 
式 ， 我 们 终于 绕 过 了 borrow checker。 但 是 ， 为 了 绕 过 编译 器 的 限制 ， 
我 们 付出 了 一 些 代 价 。 这 段 代 码 ， 我 们 需要 执行 两 次 hash 碍 找 ， 一 次 在 
contains 方 法 ， 一 次 在 get_mnut 方 法 ， 因 此 它 有 额外 的 性 能 开销 。 这 也 是 
为 什么 标准 库 中 的 HashMap 设 计 了 一 个 叫 作 entry 的 api， 如 采用 entry 来 
写 这 段 逻 辑 ， 可 以 这 么 做 : 





fn get_default3<'m,K,V:Default>( 

map: &'m mut HashMap<K,V>， 

key: K) 

-> &'m mut Vv 

{ 

map.entry(key) 

.Or_insert with(|| V::default()) 

} 





这 个 设计 既 清 晰 简洁 ， 也 没有 额外 的 性 能 开销 ， 而 且 不 需要 Non- 
Lexical-Lifetime 的 支持 。 这 说 明 ， 昌 然 老 版 本 的 生命 周期 检查 确实 有 扣 


过 于 严格 ， 但 至 少 在 茶 些 场景 下 ， 我 们 其 实 还 是 有 办 法 纸 过 去 的 ， 不 一 
定 要 在 “良好 的 抽象 "和 “安全 性 ?之 间 做 选择 。 但 是 它 付出 了 其 他 的 代 
价 ， 那 惑 是 设计 难度 更 高 ， 更 不 容易 被 掌握 。 标 准 库 中 的 entry API 也 是 
很 多 高 手 经 过 很 长 时 间 才 最 终 设 计 出 来 的 产物 。 对 于 普通 用 户 而 言 ， 如 
果 在 其 他 场景 下 出 现 了 类 似 的 冲突 ， 怒 怕 大 部 分 人 虱 没 有 能 力 想 到 一 个 
最 佳 方案 ， 可 以 既 避 过 编译 占 限 制 ， 叉 不 损失 性 能 。 所 以 在 实践 中 的 很 
多 场景 下 ， 普 通用 户 做 不 到 “ 零 开 销 抽象 ”。 


让 编译 器 能 更 准确 地 分 析 借用 指针 的 生命 周期 ， 不 要 简单 地 与 
scope 相 绑 定 ， 不 论 对 普通 用 户 还 是 高 阶 用 户 都 是 一 个 更 合理 、 更 有 用 
的 功能 。 如 果 编 译 器 能 有 这 么 聪明 ， 那 么 它 应 该 能 理解 下 面 这 段 代码 其 
实 是 安全 的 : 














match map ,get_mut(&key) { 
Some(value) => process(value)，// 找到 了 就 继续 处 理 这 个 值 
None => 
map.insert(key，V::default()); // 没 找 到 key 就 插入 一 个 新 的 值 


























这 段 代码 既 符合 用 户 直观 思维 模式 ， 又 没有 破坏 Rust 的 安全 原则 。 
以 前 的 编译 器 无 法 编译 通过 ， 实 际 上 是 对 正确 程序 的 误伤 ， 是 一 种 应 访 
修复 的 缺陷 。NLL 的 设计 目的 就 是 让 Rust 的 安全 检查 更 加 准确 ， 减 少 误 
报 ， 使 得 编译 器 对 程序 员 的 香 肘 更 少 。 


打开 NLL 功 能 ， 以 下 代码 就 可 以 编译 通过 了 : 











#![feature(n1ll)] 
use std::collections::HashMap; 
fn process or_default4(map: &mut HashMap<String, String>, key: String) 


match map.get_mut(&key) { 
Some(value) => println!("{}", value), 
None => { 
map.insert(key, String::new()); 


} 
} 


fn main() { 
let mut map = HashMap::<String, String>: :new(); 
let key = String::from("abc"); 
process_or_default4(&mut map, key); 


14.2 NLL 的 原理 


NLL 的 设计 目的 是 让 “借用 ”的 生命 周期 不 要 过 长 ， 适 可 而 止 ， 避 人 免 
不 必要 的 编译 错误 ， 把 实际 上 正确 的 代码 也 一 起 拒绝 挥 。 但 是 实现 方法 
不 能 是 简单 地 在 AST 上 找 以 下 茶 个 引用 最 后 一 次 在 哪里 使 用 ， 就 让 它 的 
生命 周期 结束 算 了 。 我 们 用 例子 来 说 明 : 











fn baz() { 
let mut data = vec!['a', 'b', 'c']; 
let slice = &mut datal[..]; // <-+ lifetime if we ignored 
loop { // | variables altogether 


data.push('d'); // Should be error, but would not be. 


} 
data.push('e'); // OK 
data.push('f'"); // OK 





在 这 个 示例 中 ， 我 们 引入 了 一 个 循环 结构 。 如 果 我 们 只 是 分 析 AST 
的 结构 的 话 ， 很 可 能 会 觉得 capitalize 函 数 结束 后 ，slice 的 生命 周期 就 结 
束 了 ， 因 此 data.push〈) 方法 调用 是 合理 的 。 但 这 个 结论 是 错误 的 ， 
为 这 里 有 一 个 循环 结构 。 大 家 想 想 看 ， 如 果 执 行 了 push〈) 方法 后 ， 引 
发 了 Vec 数 据 结构 的 扩容 ， 它 把 以 前 的 空间 释放 掉 ， 申 请 了 新 的 空间 ， 
进入 下 一 轮 循 环 的 时 候 ，slice 就 会 指 同一 个 非法 地 址 ， 会 出 现 内 存 不 安 
全 。 以 上 这 段 代码 理应 出 现 编译 错误 。 


因 些 ， 新 版 本 的 借用 检查 器 将 不 再 基于 AST 的 语句 块 来 设计 ， 而 是 
将 AST 转 换 为 另外 一 种 中 间 表 达 形 式 MIR (middle-level intermediate 
representation) 之后， 在 MIR 的 基础 上 做 分 析 。 这 是 因为 前 面 已 经 分 析 
过 了 ， 对 于 复杂 一 点 的 程序 逻辑 ， 基 于 AST 来 做 生命 周期 分 析 是 费力 不 
讨好 的 事情 ， 而 MIR 则 更 适合 做 这 种 分 析 。 读 者 可 以 用 以 下 编译 器 命令 
打印 出 MIR 的 文本 格式 : 











rustc --emit=mir test.rs 





不 过 在 一 般 情况 下 ，MIR 在 编译 器 内 部 的 表现 形式 是 内 存 中 的 一 组 
数据 结构 。 这 些 数 据 结 构 插 述 的 古 一 个 叫 作 “控制 流 图 ”(control flow 


graph) 的 概念 。 所 谓 控制 流 图 ， 就 是 用 “图 "这 种 数据 结构 ， 描 述 程序 的 
执行 流程 。 每 个 函数 都 有 一 个 MIR 来 描述 它 ， 比 如 对 于 以 下 这 段 代码 ; 





fn send_if2(data: Vec<Data>) { 
If Some_condition(&data) { 
send_to_other_thread(data); 
return; 


} 


process(&data); 





生成 的 控制 流 图 如 图 14-1 所 示 。 


图 上 面 有 节点 ， 也 有 边 。 节 点 代表 一 条 或 者 一 组 语句 ， 边 代表 分 文 
跳 转 。 有 了 这 个 图 ， 引 用 的 生命 周期 就 可 以 用 这 个 图 上 的 市 扣 来 表示 
了 。 编 译 器 最 后 会 分 析出 来 ， 引 用 在 这 个 图 上 的 哪些 节点 上 还 是 活 帮 
的 ， 在 哪些 节点 上 可 以 看 作 已 经 死 挥 了 。 相 比 于 以 前 ， 一 个 引用 的 生命 
周期 直接 充满 整个 语句 块 ， 现 在 的 表达 方式 明显 要 精细 得 多 ， 这 样 我 们 
就 可 以 保证 引用 的 生命 周期 不 会 被 过 分 拉 长 。 


if some condition (&data) send to other thread(data) 


false 


process (&data) 
drop (data) 


return 


图 14-1 


这 个 新 版 的 借用 分 析 器 ， 会 允许 下 面 的 代码 编译 成 功 ， 比 如 : 















#![feature(n1l1)] 

fn main() { 
let mut v = vec![1,2,3,4,5]; 
Vv.push(v.len()); // 同一 行 , 既 有 & 型 借用 ,也 有 &mut 型 借用 。 但 逻辑 上 是 安全 的 
println!i("{:?}", VvV); 















































} 





目前 版 本 中 ， 如 果 去 挥 #! [feature Cnll) ] 束 会 出 现 编译 错误 
再 比如 : 





#![feature(n1ll)] 

fn main() { 
let mut data = 100_i32,; 
let mut p = &data; // p is live 
println!("{}", p); // p is dead 


data = 101; 
p = &data; // p is live again 
println!("{}", p); // p is dead again 





上 面 这 个 示例 启用 了 新 的 生命 周期 分 析 嚣 后， 也 可 以 编译 成 功 。 
不 会 再 把 p 指 针 的 生命 周期 当成 从 声明 到 语句 块 结束 ， i 
了 到 第 一 次 printIn! 就 可 以 结束 了 ， 后 面 的 data 又 重新 赋值 的 时 候 不 会 
跟 它 冲突 。 

另外 需要 强调 的 是 : 

:这 个 功能 只 影响 静态 分 析 结 果 ， 不 影响 程序 的 执行 情况 ; 


以 前 能 编译 通过 的 程序 以 后 依然 会 编译 通过 ， 不 会 影响 以 前 的 代 


` 它 依然 保证 了 安全 性 ， 只 十 将 以 前 过 于 保守 的 检查 规则 适当 放 


澡 








' 它 依赖 的 依然 是 静态 检查 规则 ， 不 会 涉及 任何 动态 检查 规则 ; 


它 只 影响 “引用 类 型 * 的 生命 周期 ， 不 影响 “对 象 * 的 生命 周期 ， 即 维 
持 现 有 的 析 构 函数 调用 时 机 不 变 ; 


它 不 会 影响 RAII 语 义 。 
在 编写 本 书 之 时 ， 此 功能 还 没有 完全 实现 ， 但 是 鉴于 该 功能 的 重要 


性 ， 笔 者 依然 觉得 非常 有 必要 回 各 位 读者 提前 介绍 。 和 希望 该 功能 尽快 完 
成 ， 以 减少 不 必要 的 编译 错误 对 新 手 的 困扰 。 





| 二 本 二 





内 存 安全 是 需要 一 些 代码 规范 来 约束 才能 实现 的 。 这 就 好 比 交通 安 
全 是 需要 区 通 法 规 来 约束 才能 实现 一 样 。 我 们 不 能 因为 茶 个 具体 的 人 在 
茶 个 具体 的 路 段 上 不 能 直达 目标 ， 不 得 不 绕 路 而 行 ， 而 否定 整个 交通 法 
规 的 意义 。 交 通 法 规 本 和 喘 肯 定 还 有 值得 优化 的 地 方 ， 但 它 优 化 的 方 同 应 
该 是 让 社会 平均 交通 事故 率 下 降 ， 提 高 社会 平均 通行 效率 ， 不 能 痢 眼 于 
特定 时 间 特 定位 置 。NLL 的 设计 就 是 朝 这 个 方向 前 进 的 。Rust 中 的 生命 
周期 是 一 个 初学 者 不 易 理解 的 难点 ， 而 且 也 确实 存在 一 些 情况 损害 了 语 
言 的 表达 能 力 。 但 我 们 不 应 该 轻易 地 否定 生命 周期 这 个 设计 ， 而 是 应 该 
做 一 些 更 精细 的 、 准 确 的 调整 ， 使 它 尽 可 能 接近 “安全 ”与 “不 安全 ”的 那 
条 分 界线 ， 不 侦 不 傈 ， 人 否则 宽 严 香 误 。 


在 C/C++ 的 领域 ， 为 了 提高 软件 可 靠 性 而 设计 的 代码 规范 其 实 有 很 
多 ， 这 些 先 贰 总 结 出 来 的 C/C++ 的 设计 范式 和 惯用 法 是 非常 有 利于 提高 
代码 质量 、 降 低 安 全 风险 的 。 但 是 可 惜 的 是 ， 这 些 民 好 的 设计 范式 并 不 
是 所 有 人 都 能 遵守 的 ， 就 好 比 大 街 上 总 是 有 人 试图 抄 近 路 ， 违 反 交 通 规 
则 而 导致 交通 事故 一 样 。 这 些 人 不 理解 一 个 统一 的 代码 规范 对 于 整个 项 
目 代 码 质 量 的 意义 。 一 旦 在 项 目 中 挫 入 了 一 些 禹 有 “ 坏 味 道 ” 的 代码 ， 那 
它 束 不 一 定 在 哪 天 给 项 目 带 来 一 个 出 其 不 意 的 问题 ， 哪 怕 只 是 一 个 简单 
的 赋值 、 函 数 调 用 ， 都 可 能 触发 完全 超过 预期 的 结 


A rule is worthless if it is not enforced. 如 果 规 则 不 能 强制 执行 ， 那 么 
这 个 规则 就 是 没有 价值 的 。 因 此 ，C/C++ 的 领域 内 也 出 现 了 一 大 批 静态 
代码 检查 工具 。 这 些 工 具 可 以 帮助 我 们 提高 代码 规范 的 严肃 性 和 可 执行 
性 ， 从 而 间接 增强 代码 的 可 靠 程 度 。 但 是 可 惜 的 是 ，C/C++ 的 静态 代码 
检查 工 具 远 称 不 上 完美 ， 它 总 会 有 误 报 或 者 漏 报 的 情况 发 生 。 而 Rust 则 
在 这 个 方 同 上 更 进 了 一 步 ， 保 证 了 segment fault 这 一 类 内 存 安 全 问题 ， 
可 以 在 静态 代码 检查 阶段 “完整 无 遗漏 ”地 被 检查 出 来 。 


Rust 之 所 以 能 达到 这 么 好 的 检查 效果 ， 并 不 是 因为 设计 者 及 明了 什 
么 高 深 的 算法 ， 或 者 比 做 C/C++ 静 态 检查 的 人 更 聪明 。 主 要 原因 是 设计 
者 们 “ 作 浆 "了 ， 他 们 直接 简化 了 被 研究 对 象 。C/C++ 由 于 本 质 上 的 灵活 
性 太 强 ， 使 得 条 些 安全 问题 检查 极其 难以 实现 。 而 Rust 在 设计 的 时 候 束 
一 直 将 这 些 问 题 考虑 在 内 ， 所 有 的 功能 都 不 能 影响 “内 存 安全 ”的 设计 。 






































当然 ，Rust 的 这 种 设计 目 然 就 带 来 了 Rust 独 有 的 新 的 设计 范式 。 有 
些 C/C++ 风 格 的 代码 在 Rust 里 面 就 很 难 写 出 来 ， 但 这 并 不 一 定 意味 着 “ 表 
达能 力 低 ”， 往 往 是 因为 用 地 道 的 Rust 处 理 同 样 的 问题 是 另外 一 种 你 不 
熟悉 的 风格 而 己 。 要 搞 清楚 这 种 Rust 风 格 的 代码 究竟 是 怎样 的 ， 就 需要 
多 读 高 质量 的 开源 的 Rust 代 码 来 培养 感觉 。 











第 15 半 ”内 部 可 变性 


Rust 的 borrow checker 的 核心 思想 是 “共享 不 可 变 ， 可 变 不 共享 "。 但 
是 只 有 这 个 规则 是 不 够 的 ， 在 某 些 情况 下 ， 我 们 的 确 需 要 在 存在 共享 的 
情况 下 可 变 。 为 了 让 这 种 情况 是 可 控 的 、 安 全 的 ，Rust 还 设计 了 一 
种 “内 部 可 变性 ”(interior mutability) 。 


“内 部 可 变性 ”的 概念 ， 是 与 “承袭 可 变性 ”(inherited mutability) 相 
对 应 的 。 大 家 应 该 注意 到 了 ，Rust 中 的 mut 关 键 字 不 能 在 声明 类 型 的 时 
候 使 用 ， 只 能 跟 变 量 一 起 使 用 。 类 型 本 身 不 能 规定 自己 是 否 是 可 变 的 。 
一 个 变量 是 否 是 可 变 的 ， 取 决 于 它 的 使 用 环境 ， 而 不 是 它 的 类 型 。 可 变 
还 是 不 可 变 取 决 于 变量 的 使 用 方式 ， 这 就 叫 作 “ 承 多 可 变性 ”"。 如 果 我 们 
用 let var: T; 声明 ， 那 么 var 是 不 可 变 的 ， 同 时 ，var 内 部 的 所 有 成 员 也 
都 是 不 可 变 的 ; 如果 我 们 用 let mut var: T; 声明 ， 那 么 var 是 可 变 的 ， 
相应 的 ， 它 的 内 部 所 有 成 员 也 都 是 可 变 的 。 我 们 不 能 在 类 型 声明 的 时 候 
指定 可 变性 ， 比 如 在 struct 中 对 某 部 分 成 员 使 用 mut 修 饰 ， 这 是 不 合法 
的 。 我 们 只 能 在 变量 声明 的 时 候 指定 可 变性 。 我 们 也 不 能 针对 变量 的 某 
一 部 分 成 员 指定 可 变性 ， 其 他 部 分 保持 不 变 。 


常见 的 具备 内 部 可 变性 特点 的 类 型 有 Cell、RefCell、Mutex、 
RwLock、Atomic* 等 。 其 中 Cell 和 RefCell 是 只 能 用 在 单线 程 环 境 下 的 具 
备 内 部 可 变性 的 类 型 。 下 面 就 来 讲解 何 为 “内 部 可 变性 ”。 






































15.1 Cell 


按照 前 面 的 理论 ， 如 果 我 们 有 共享 引用 指 问 一 个 对 象 ， 那么 这 个 对 
象 束 不 会 被 更 改 了 。 因 为 在 共 至 引用 存在 的 期 间 ， 不 能 有 可 变 引 用 同时 
指 问 它 ， 因 此 它 一 定 是 不 可 变 的 。 其 实在 Rust 中 ， 这 种 想法 是 不 准确 
的 。 下 面 给 出 一 个 示例 : 

















use std::rc::Rc; 


fn main() { 
let ri = Rc: :new(1); 
println!("reference count {}", Rc::strong_count(&r1)); 
let r2 = ri.clone(); 
println!("reference count {}", Rc::strong_count(&r2)); 


} 








reference count 1 
reference count 2 





Rc 是 Rust 里 面 的 引用 计数 智能 指针 ， 在 后 文中 我 们 还 会 继续 讲解 。 
多 个 Rc 指针 可 同时 指 癌 同一 个 对 象 ， 而 且 有 一 个 共 圣 的 引用 计数 值 在 
记录 总 共有 多 少 个 Rc 指针 指向 这 个 对 象 。 


注意 Rc 指针 提供 的 是 共享 引用 ， 按 道理 它 没 有 修改 共享 数据 的 能 
力 。 但 是 我 们 用 共享 引用 调用 clone 方 法 ， 引 用 计数 值 发 生 了 变化 。 这 就 
是 我 们 要 说 的 “内 部 可 变性 *"。 如 果 没 有 内 部 可 变性 ， 标 准 库 中 的 Rc 类 型 
是 无 法 正确 实现 出 来 的 。 具备 内 部 可 变性 的 类 型 最 典型 的 就 是 Cell。 


现在 用 一 个 更 浅显 的 例子 来 演示 一 下 Cell 的 能 








use std::cell::Cell; 


fn main() { 
let data : Cell<i32> = Cell::new(100); 
let p = &data; 
vdata. set (10); 
println!("{}", p.get()); 


p.set(20) 
println!("{:?}", data); 


这 次 编译 通过 ， 执 行 ， 结 果 是 符合 我 们 的 预期 的 : 





10 
Cell { value: 20 } 








请 注意 这 个 例子 最 重要 的 特点 。 需 要 注意 的 是 ， 这 里 的 “可 变性 ” 问 
题 跟 我 们 前 面 见 到 的 情况 不 一 样 了 。data 这 个 变量 绑 定 没有 用 mut 修 
饰 ，p 这 个 指针 也 没有 用 &mut 修 饰 ， 然 而 不 可 变 引 用 竞 然 可 以 调用 set 函 
数 ， 改 变 了 变量 的 值 ， 而 且 还 没有 出 现 编译 错误 。 


这 就 是 所 谓 的 内 部 可 变性 一 一 这 种 类 型 可 以 通过 共享 指针 修改 它 内 
部 的 值 。 虽 然 粗 略 一 看 ，Cell 类 型 似乎 违反 了 Rust 的 “唯一 修改 权 ” 原 
则 。 我 们 可 以 存在 多 个 指向 Cell 类 型 的 不 可 变 引 用 ， 同 时 我 们 还 能 利用 
不 可 变 引 用 改变 Cell 内 部 的 值 。 但 实际 上 ， 这 个 类 型 是 完全 符合 “内 存 安 
全 ”的 。 我 们 再 想 想 ， 为 什么 Rust 要 尽力 避免 alias 和 mutation 同时 存在 ? 
因为 假如 我 们 同时 有 可 变 指针 和 不 可 变 指针 指 癌 同一 块 内 存 ， 有 可 能 
现 通过 一 个 可 变 指针 修改 内 存 的 过 程 中 ， 数 据 结构 处 于 被 破坏 状态 的 情 
况 下 ， 被 其 他 的 指针 观测 到 。Cell 类 型 是 不 会 出 现 这 样 的 情况 的 。 因 为 
Cell 类 型 把 数据 包 于 在 内 部 ， 用 户 无 法 获得 指向 内 部 状态 的 指针 ， 这 意 
味 着 每 次 方法 调用 都 是 执行 的 一 次 完整 的 数据 移动 操作 。 每 次 方法 调用 
之 后 ，Cell 类 型 的 内 部 都 处 于 一 个 正确 的 状态 ， 我 们 不 可 能 观察 到 数据 
被 破坏 挥 的 状态 。 


多 个 共享 指针 指向 Cell 类 型 的 状态 就 类 似 图 15-1 所 示 的 这 样 ，Cell 就 
是 一 个 “ 壳 ”， 它 把 数据 严 严 实 实地 包 囊 在 里 面 ， 所 有 的 指针 只 能 指向 
Cell， 不 能 直接 指向 数据 。 修 改 数据 只 能 通过 Cell 来 完成 ， 用 户 无 法 创 
造 一 个 直接 指向 数据 的 指针 。 













































共享 引用 






提 享 引用 


Cell 
(内 部 可 变性 ) 










共 盏 引用 


图 15-1 





我 们 来 仔细 观察 一 下 Cell 类 型 提供 的 公开 的 API， 束 能 理解 Cell 类 型 
设计 的 意义 了 。 下 面 是 Cell 类 型 提供 的 几 个 主要 的 成 员 方 法 : 








impl<T> Cell<T> { 
pub fn get_ mut(&mut self) -> &mut T { } 
pub fn set(&self, val: T) { } 
pub fn swap(&self, other: &Self) { } 
pub fn replace(&self, val: T) ->TH{ } 


pub fn into_inner(self) ->TH{ } 
} 


impl<T:Copy> Cell<T> { 


pub fn get(&self) -> TH{ } 





get_mut 方 法 可 以 从 &mut Cell<T> 类 型 制造 出 一 个 &mut T 型 指针 。 
因为 &mut 型 指针 具有 “独占 性 ”， 所 以 这 个 函数 保证 了 调用 前 ， 有 且 仪 
有 一 个 “可 写 ?” 指 针 指向 Cell， 调 用 后 有 且 仅 有 一 个 “可 写 ? 指 针 指向 内 部 
数据 。 它 不 存在 制造 多 个 引用 指 问 内 部 数据 的 可 能 性 。 





-set 方 法 可 以 修改 内 部 数据 。 它 是 把 内 部 数据 整个 替换 掉 ， 不 存在 


多 个 引用 指 问 内 部 数据 的 可 能 性 。 


:swap 方法 也 是 修改 内 部 数据 。 跟 set 方 法 一 样 ， 也 是 把 内 部 数据 整 
体 蔡 换 掉 。 与 std: : mem: : swap 函 数 的 区 别 在 于 ， 它 仪 要 求 & 引 用 ， 
不 要 求 &mut 引 用 。 


:Teplace 方 法 也 是 修改 内 部 数据 。 跟 set 方 法 一 样 ， 它 也 是 把 内 部 数 
据 整 体 蔡 换 ， 唯 一 的 区 别 是 ， 换 出 来 的 数据 作为 返回 值 返回 了 。 


:into_inner 方 法 相当 于 把 这 个 “ 壳 ? 和 剥 掉 了 。 它 接受 的 是 Self 类 型 ， 即 
move 语 义 ， 原 来 的 Cell 类 型 的 变量 会 被 move 进 入 这 个 方法 ， 会 把 内 部 数 
据 整 体 返 回 出 来 。 


“get 方法 接受 的 是 &self 参 数 ， 返 回 的 是 T 类 型 ， 它 可 以 在 保留 之 前 
Cell 类 型 不 变 的 情况 下 返回 一 个 新 的 T 类 型 变量 ， 因 此 它 要 求 T: Copy 约 
人 每 次 调用 它 的 时 候 ， 都 相当 于 把 内 部 数据 memcpy 了 一 份 返回 出 


正 因 为 上 面 这 些 原因 ， 我 们 可 以 看 到 ，Cell 类 型 虽然 违背 了 “共享 不 
可 变 ， 可 变 不 共享 ”的 规则 ， 但 它 并 不 会 造成 内 存 安 全 问题 。 它 把 “共享 
有 旦 可 变 ” 的 行为 放 在 了 一 种 可 靠 、 可 探 、 可 信赖 的 方式 下 进行 。 它 的 API 
是 经 过 仔细 设计 过 的 ， 绝 对 不 可 能 让 用 户 有 机 会 通过 &Cetl<T> 获 得 &T 
或 者 &mut T。 它 是 对 aliastmutation 原 则 的 有 益 补 充 ， 而 非 完全 站 履 。 大 
家 可 以 尝试 一 下 用 更 复杂 的 例子 (如 Cell<Vec<i32>>) 试 试 ， 看 能 不 能 
构造 出 内 存 不 安全 的 场景 。 





15.2 RefCell 


RefCell 是 另外 一 个 提供 了 内 部 可 变性 的 类 型 。 它 提供 的 方式 与 Cell 
类 型 有 点 不 一 样 。Cell 类 型 没 办 法 制造 出 直接 指向 内 部 数据 的 指针 ， 而 
RefCell 可 以 。 我 们 来 看 一 下 它 的 API: 








impl<T: ?Sized> RefCell<T> { 
pub fn borrow(&self) -> Ref<T> { } 
pub fn try_borrow(&self) -> Result<Ref<T>, BorrowError> { } 
pub fn borrow mut(&self) -> RefMut<T> { } 
pub fn try_borrow mut(&self) -> Result<RefMut<T>, BorrowMutError> { } 


pub fn get mut(&mut self) -> &mut T { } 





get_mut 方 法 与 Cell: : get_mut 一 样 ， 可 以 通过 &mut self 获 得 &mut 
TI， 这 个 过 程 是 安全 的 。 除 此 之 外 ，RefCell 最 主要 的 两 个 方法 就 是 
borrow 和 borrow_mut， 男 外 两 个 try_borrow 和 try_borrow_mut 只 是 它们 俩 


的 镜像 版 ， 区 别 仅 在 于 错误 处 理 的 方式 不 同 。 
我 们 还 是 用 示例 来 演示 一 下 RefCell 怎 样 使 用 : 











use std::cell::RefCell; 


fn main() { 
let shared_ vec: RefCell<Vec<isize>> = RefCell: :new(vec![1, 2, 3]); 
let Shared1 = &shared_vec; 
let shared2 = &shared1; 


shared1.borrow mut().push(4); 
println!("{:?}", shared_vec.borrow()); 


shared2.borrow mut().push(5); 
println!("{:?}", shared_vec.borrow()); 





在 这 个 示例 中 ， 我 们 用 一 个 RefCell 包 了 一 个 Vec， 并 且 制 造 了 另外 
两 个 共享 引用 指向 同一 个 RefCell。 这 时 ， 我 们 可 以 通过 任何 一 个 共享 引 
用 调用 borrow_mut 方 法 ， 获 得 指 癌 内 部 数据 的 “可 写 ” 指 针 ， 通 过 这 个 指 








针 调用 了 push 方 法 ， 修 改 内 部 数据 。 同 时 ， 我 们 也 可 以 通过 调用 borrow 
方法 获得 指 问 内 部 数据 的 “只 读 ” 指 针 ， 读 取 Vec 里 面 的 值 。 








$ ./test 
[1, 2, 3, 4] 
[1, 2, 3, 4, 5] 





这 里 有 一 个 小 问题 需要 跟 大 家 解释 一 下 : 在 函数 的 签名 中 ，borrow 
方法 和 borrow_mut 方 法 返回 的 并 不 是 &T 和 &mut T， 而 是 Ref<T> 和 
RefMut<T>。 它 们 实际 上 是 一 种 “智能 指针 ”， 完 全 可 以 当 作 &T 和 &mut 
T 的 等 价 物 来 使 用 。 标 准 库 之 所 以 返回 这 样 的 类 型 ， 而 不 是 原生 指针 类 
型 ， 是 因为 它 需 要 这 个 指针 生命 周期 结束 的 时 候 做 点 事情 ， 需 要 目 定 义 
类 型 包装 一 下 ， 加 上 和 目 定 义 析 构 函数 。 至 于 包装 起 来 的 类 型 为 什么 可 以 
直接 当成 指针 使 用 ， 它 的 原理 可 以 参考 下 一 章 “ 解 引用 ”。 


那么 问题 来 了 : 如 果 borrow 和 borrow_mut 这 两 个 方法 可 以 制造 出 指 
问 内 部 数据 的 只 读 、 可 读 写 指 针 ， 那 么 它 是 怎么 保证 安全 性 的 呢 ? 像 前 
几 章 讲 的 那样 ， 如 果 同 时 构造 了 只 读 引 用 和 可 读 写 引用 指 癌 同一 个 
Vec， 那 不 是 很 容易 就 构造 出 悬空 指针 么 ? 答案 是 ，RefCell 类 型 放弃 了 
编译 阶段 的 aliastmutation 原 则 ， 但 依然 会 在 执行 阶段 保证 aliastmutation 
原则 。 示 例如 下 : 




















use std::cell::RefCell; 


fn main() { 
let Shared_vec: RefCell<Vec<isize>> = RefCell::new(vec![1, 2, 3]); 
let Shared1 = &shared_vec; 
let shared2 = &shared1; 


let pi = shared1.borrow(); 
let p2 = &p1i[0]; 


shared2.borrow mut().push(4); 
println!("{}", p2); 





上 面 这 个 示例 的 意图 是 : 我 们 先 调用 borrow 方 法 ， 并 制造 一 个 指 问 
数组 第 一 个 元 素 的 指针 ， 接 着 再 调用 borrow_mnut 方 法 ， 修 改 这 个 数组 。 
这 样 ， 就 构造 出 了 同时 出 现 alias 和 mnutation 的 场景 。 


编译 ， 通过 。 执行 ， 问题 来 了 ， 程序 出 现 了 panic: 





$ ./test 
thread 'main' panicked at 'already borrowed: BorrowMutError', src\libcore\result.rs: 
note: Run with ‘RUST_BACKTRACE=1 for a backtrace. 





出 现 panic 的 原因 是 ，RefCel 探 测 到 同时 出 现 了 alias 和 mnutation 的 情 
况 ， 它 为 了 防止 更 粳 糕 的 内 存 不 安全 状态 ， 直 接 使 用 了 panic 来 拒绝 程序 
继续 执行 。 如 果 我 们 用 try_borrow 方 法 的 话 ， 就 会 发 现 返 回 值 是 
Result: : Err， 这 是 另外 一 种 更 友好 的 错误 处 理 风格 。 


那么 RefCell 是 怎么 探测 出 问题 的 呢 ? 原因 是 ，RefCell 内 部 有 一 
个 “借用 计数 器 ”， 调 用 borrow 方 法 的 时 候 ， 计 数 嚣 里面 的 “共享 引用 计 
数 ” 值 束 加 1。 当 这 个 borrow 结 束 的 时 候 ， 会 将 这 个 值 自 动 减 1 (如 图 15-2 
所 示 ) 。 同 样 ，borrow_mnut 方 法 被 调用 的 时 候 ， 它 就 记录 一 下 当前 存 
在 “可 变 引 用 ”。 如 果 “ 共 享 引用 ”和 “可 变 引 用 ”同时 出 现 了 ， 就 会 报错 。 









borrow'() 











RefCell 


读 写 引用 计数 


直至 引用 


图 15-2 


从 原理 上 来 说 ，Rust 默 认 的 “借用 规则 检查 器 ”的 逻辑 非常 像 一 个 在 
编译 阶段 执行 的 * 读 写 锁 ” (read-write-locker) 。 如 果 同 时 存在 多 
个 * 读 ”的 锁 ， 是 没 问 题 的 ， 如 果 同 时 存在 “ 读 ” 和 “ 写 ” 的 锁 ， 或 者 同时 存 
在 多 个 “ 写 ” 的 锁 ， 就 会 发 生 错 误 。RefCell 类 型 并 没有 打破 这 个 规则 ， 只 


不 过 ， 它 把 这 个 检查 逻辑 从 编译 阶段 移 到 了 执行 阶段 。RefCell 让 我 们 可 
以 通过 共享 引用 && 修 改 内 部 数据 ， 逃 过 编译 器 的 静态 检查 。 但 是 它 依 然 
在 区 琶 业 业 地 尽 可 能 保证 “内 存 安 全 ”。 我 们 需要 的 借用 指针 必须 通过 它 
提供 的 APIborrow() borrow_mut() 来 获得 ， 它 实际 上 是 在 执行 阶 
段 ， 在 内 部 维护 了 一 套 “ 读 写 锁 ” 检 查 机 制 。 一 旦 出 现 了 多 个 “ 写 ” 或 者 同 
时 读 写 ， 束 会 在 运行 阶段 报错 ， 用 这 种 办 法 来 保证 写 数据 时 候 的 执行 过 
程 中 的 内 部 状态 不 会 被 观测 到 ， 任 何 时 候 ， 开 始 读 或 者 开始 写 操 作 开 始 
的 时 候 ， 共 享 的 变量 都 处 于 一 个 合法 状态 。 因 此 在 执行 阶段 ，RefCell 是 
有 少量 开销 的 ， 它 需要 维护 一 个 借用 计数 器 来 保证 内 存 安全 。 


所 以 说 ， 我 们 一 定 不 要 过 于 小 用 RefCell 这 样 的 类 型 。 如 果 确 有 必要 
0 
问题 。 


Cell 和 RefCell 用 得 最 多 的 场景 是 和 多 个 只 读 引 用 相配 合 。 比 如 ， 多 
个 及 引用 或 者 Rc 引用 指 癌 同一 个 变量 的 时 候 。 我 们 不 能 直接 通过 这 些 只 
读 引 用 修改 变量 ， 因 为 既然 存在 alias， 就 不 能 提供 mutation。 为 了 让 存 
在 多 个 alias 共 享 的 变量 也 可 以 被 修改 ， 那 我 们 就 需要 使 用 内 部 可 变性 。 
Rust 中 提供 了 只 读 引 用 的 类 型 有 &、Rc、Arc 等 指针 ， 它 们 可 以 提供 
alias。Rust 中 提供 了 内 部 可 变性 的 类 型 有 Cell、RefCell、Mutex、 
RwLock 以 及 Atomic* 系 列 类 型 等 。 这 两 类 类 型 经 和 常 需要 配合 使 用 。 


如 果 你 需要 把 一 个 类 型 T 封 装 到 内 部 可 变性 类 型 中 去 ， 要 怎样 选择 
Cell 和 RefCell 呢 ?原则 就 是 ， 如 果 你 只 需要 整体 性 地 存 入 、 取 出 T， 那 
么 就 选 Cell。 如 果 你 需要 有 个 可 读 写 指针 指 癌 这 个 工 修改 它 ， 那 么 束 选 
RefCell 。 























15.3 UnsafeCell 


接 下 来 ， 我 们 来 分 析 Cell/RefCell 的 实现 原理 。 我 们 先 来 考虑 两 个 问 
题 ， 标 准 库 中 的 Cell 类 型 是 怎样 实现 的 ? 假如 让 我 们 自己 来 实现 一 遍 ， 
是 否 可 行 呢 ? 


模仿 标准 库 中 的 Cell 类 型 的 公开 方法 (只 考虑 最 简单 的 new、get、 
set 这 三 个 方法 ) ， 我 们 先 来 一 个 最 简单 的 版 本 V1: 








Struct CellV1i<T> { 
value: T 
} 


impl<T> CellV1i<T> { 


fn new(v: T) -> Self where T: Copy { 
CellVi { value: v} 


fn set(&self, v: T) { 
self.value = v; 


} 


fn get(&self) -> T where T: Copy { 
self .value 
} 
} 





这 个 版 本 是 一 个 new type 类 型 ， 内 部 包含 了 一 个 T 类 型 的 成 员 。 成 
员 方 法 对 类 型 T 都 有 恰当 的 约束 。 这 些 都 没 错 。 只 有 一 个 关键 问题 需要 
注意 : 对 于 set 方 法 ， 直 接 这 样 写 是 肯定 行 不 通 的 ， 因 为 self 是 只 读 引 
用 ， 我 们 不 可 能 直接 对 self.value 赋 值 。 而 且 ，Cell 类 型 最 有 用 的 地 方 就 
在 于 ， 它 可 以 通过 不 可 变 引用 改变 内 部 的 值 。 那 么 这 个 问题 怎么 解决 
呢 ? 可 以 使 用 unsafe 关 键 字 。 后 面 还 有 一 章 专 门 讲 解 unsafe， 此 处 只 需 
知道 ， 用 unsafe 包 起 来 的 代码 块 可 以 突破 编译 器 的 一 些 限制 ， 做 一 些 平 
第 不 能 做 的 事情 。 


以 下 是 修正 版 : 

















struct CellV2<T> { 
value: T 
} 


impl<T> CellV2<T> { 


fn new(v: T) -> Self where T: Copy { 
CellV2 { value: v} 


fn set(&self, v: T) where T: Copy { 


unsafe { 
let p = &(self.value) as *const T as *mut T;// 此 处 实际 上 引入 了 未 定义 行为 
“p=v; 

} 


} 


fn get(&self) -> T where T: Copy { 
self .value 
} 





在 使 用 unsafe 语 句 块 之 后 ， 这 上 段 代码 可 以 编译 通过 了 。 这 里 的 关键 
是 ， 在 unsafe 代 码 中 ， 我 们 可 以 把 *const TT 类 型 强制 转换 为 xmut 工 类 型 。 
这 是 初学 者 最 直观 的 解决 方案 ， 但 这 个 方案 是 错误 的 。 通 过 这 种 方式 ， 
ee 通过 下 面 简单 的 示例 可 以 看 到 ， 这 段 代 码 是 符合 我 
门 的 预期 的 : 











fn main() { 
let c = CellV2::new(1 isize); 
let p = &c; 


printin!("{}", c.get()); 








从 以 上 代码 可 以 看 出 ， 这 正 是 内 部 可 变性 类 型 的 特点 ， 即 通过 共享 
指针 ， 修 改 了 内 部 的 值 。 


事情 就 这 么 简单 么 ? 很 可 惜 ， 有 这 种 想法 的 人 都 过 于 naive 了 。 下 面 
这 个 示例 会 给 大 家 泼 一 盆 冷 水 : 





Struct Table<'arg> { 
cell: CellV2<&'arg isize> 
} 


fn evil<'long,'short>(t: &Table<'long>, s: &'short isize) 
where 'long : 'short 


// The following assignment is not legal, but it escapes from lifetime checking 
let u: &Table<'short> = t; 
u.cell.set(s); 


fn innocent<'long>(t: &Table<'long>) { 
let foo: isize = 1; 
evil(t, &foo); 


fn main() { 
let local = 100; 
let table = Table { cell: CellV2::new(&local) }; 
innocent(&table); 
// reads ‘foo’, which has been destroyed 
let p = table.cell.get(); 
println!("{}", p); 





如 果 我 们 用 rustc temp.rs 编 译 debug 版 本 ， 可 以 看 到 执行 结果 为 1。 


如 果 我 们 用 rustc-O temp.rs 编 译 release 版 本 ， 可 以 看 到 执行 结果 为 
140733369053192。 


这 是 怎么 回 事 呢 ? 因为 这 段 代码 中 出 现 了 野 指 针 。 我 们 来 分 析 一 下 
这 段 测试 代码 。 在 这 段 测 试 代 码 中 ， 我 们 在 CellV2 类 型 里 面 保 存 了 一 个 
引用 。main 函 数 调 用 了 innocent 函 数 ， 继 而 又 调用 了 evil 函 数 。 这 里 需要 
特别 注意 的 是 : 在 evil 函 数 中 ， 我 们 调用 了 CellV2 类 型 的 set 方 法 ， 改 变 
了 它 里 面 存 储 的 指针 。 修 改 后 的 指针 指 回 的 谁 呢 ? 是 innocent 函 数 内 部 
的 一 个 局 部 变量 。 最 后 在 main 函 数 中 ，innocent 函 数 返 回 后 ， 再 把 这 个 
CellV2 里 面 的 指针 拿 出 来 使 用 ， 就 得 到 了 一 个 野 指 针 。 


我 们 继续 从 生命 周期 的 角度 深入 分 析 ， 这 个 野 指 针 的 成 因 。 在 main 
函数 的 开始 ，table.cell 变量 保 存 了 一 个 指向 local 变 量 的 指针 。 这 是 没 问 
题 的 ， 因 为 local 的 生命 周期 比 table 更 长 ，table.cell 指 向 它 肯 定 不 会 有 问 
题 。 有 问题 的 是 table.cell 在 evil 函 数 中 被 重新 赋值 。 这 个 赋值 导致 了 
table.cell 保 存 了 一 个 指 同 局 部 调用 栈 上 的 变量 。 也 就 是 这 里 出 的 问题 : 














// t: &Table<'long> 

let U: &Table<'short> = 七 
// s: &'short isize 
u.cell.set(s); 





我 们 知道 ， 在 long: 'short 的 情况 下 ，&'1long 类 型 的 指针 同 &'short 类 
型 赋值 是 没 问 题 的 。 但 是 这 里 的 &Table<'long> 类 型 的 变量 赋值 给 
&Table<'short> 类 型 的 变量 合理 吗 ? 事实 证 明 ， 不 合理 。 证 明 如 下 。 我 
们 把 上 例 中 的 CellV2 类 型 改 用 标准 库 中 的 Cell 类 型 试 试 : 


type CellV2<T> = std::cell::Cell<T>,; 





其 他 测试 代码 不 变 。 编 译 ， 提 示 错 误 为 : 





error[E0308]: mismatched types 
-> temp.rs:11:29 

11 | let u: &Table<'short> = t; 

| ^ lifetime mismatch 

| 


= note: expected type ‘&Table<'short>. 
= note: found type ‘&Table<'long>. 





果然 是 这 里 的 问题 。 使 用 我 们 自己 写 的 CellV2 版 本 ， 这 上 段 测试 代码 
可 以 编译 通过 ， 并 制造 出 了 内 存 不 安全 。 使 用 标准 库 中 的 Cell 类 型 ， 编 
译 器 成 功 发 现 了 这 里 的 生命 周期 间 题 ， 给 出 了 提示 。 


这 说 明了 CellV2 的 实现 依然 是 错误 的 。 虽 然 最 基本 的 测试 用 例 通 过 
了 ， 但 是 倍 到 复杂 的 测试 用 例 ， 它 还 是 不 够 “健壮 >”。 而 Rust 对 于 “内 存 不 
安全 ”问题 是 绝对 禁止 的 。 不 像 C/C++， 在 Rust 语 言 中 ， 如 果 有 机 会 让 用 
户 在 不 用 unsafe 的 情况 下 制造 出 内 存 不 安全 ， 这 个 贡 任 不 是 由 用 户 来 承 
担 ， 而 是 应 该 归 因 于 写 编译 器 或 者 写 库 的 人 。 在 Rust 中 ， 写 库 的 人 不 需 
要 去 用 一 堆 文 档 来 同 用 户 保 证 内 存 安全 ， 而 是 必须 要 通过 编译 错误 来 保 
证 。 这 个 示例 中 的 内 存 安全 问题 ， 不 能 归 因 于 测试 代码 写 得 不 对 ， 因 为 
在 测试 代码 中 没有 用 到 任何 unsafe 代 码 ， 用 户 是 正常 使 用 而 已 。 这 个 问 
题 出 现 的 根源 还 是 CellV2 的 实现 有 问题 ， 具 体 来 说 束 是 那 段 unsafe 代 码 
Re 按照 Rust 的 代码 质量 标准 ，CellV2 版 本 是 完全 无 法 接受 的 垃圾 
尺码 。 


那么 ， 这 个 bug 该 如 何 修正 呢 ? 为 什么 &long 类 型 的 指针 可 以 加 
&'short 类 型 赋值 ， 而 &Cell<'long> 类 型 的 变量 不 能 问 &Cell<'short> 类 型 
的 变量 赋值 ? 因为 对 于 具有 内 部 可 变性 特点 的 Cell 类 型 而 言 ， 它 里 面 本 
来 是 要 保存 &long 型 指针 的 ， 结 果 我 们 给 了 它 一 个 &'short 型 指针 ， 那 么 
在 后 面 取 出 指针 使 用 的 时 候 ， 这 个 指针 所 指 回 的 内 容 已 经 销毁 ， 就 出 现 
了 时 指针 。 这 个 bug 的 解决 方案 是 ， 禁 止 具有 内 部 可 变性 的 类 型 ， 针 对 
生命 周期 参数 具有 “ 协 变 / 逆 变 ”特性 。 这 个 功能 是 通过 标准 库 中 的 
UnsafeCell 类 型 实现 的 : 



































#[lang = "unsafe_cell"] 
#[stable(feature = "rust1", since = "1.0.0")] 
pub struct UnsafeCell<T: ?Sized> { 

value: T， 


} 





请 注意 这 个 类 型 上 面 的 标记 #[lang=.….]。 这 个 标记 意味 着 这 个 类 型 是 
个 特殊 类 型 ， 是 被 编译 占 特 别 照顾 的 类 型 。 这 个 类 型 的 说 明文 档 需 要 特 
别提 示 读 一 下 : 





The core primitive for interior mutability in Rust. 
UnsafeCell<T> is a type that wraps some T and indicates unsafe interior operations ( 


Types like Cell<T> and RefCell<T> use this type to wrap their internal data. 








所 有 有 具有 内 部 可 变性 特点 的 类 型 都 必须 基于 UnsafeCell 来 实现 ， 合 
则 必然 出 现 各 种 问题 。 这 个 类 型 是 唯一 合法 的 将 &T 类 型 转 为 &mut T 类 
型 的 办 法 。 绝 对 不 允许 把 &T 直 接 转 换 为 &mutT 而 获得 可 变性 。 这 是 未 
定义 行为 。 


大 家 可 以 自行 读 一 下 Cell 和 RefCell 的 源码 ， 可 以 发 现 ， 它 们 能 够 正 
常 工作 的 关键 在 于 它们 都 是 基于 UnsafeCel 实 现 的 ， 而 UnsafeCell 本 喘 是 
编译 器 特殊 照顾 的 类 型 。 所 以 我 们 说 “内 部 可 变性 ”这 个 概念 是 Rust 语 言 
提供 的 一 个 核心 概念 ， 而 不 是 通过 库 模拟 出 来 的 。 


实际 上 ， 上 面 那个 CellV2 示 例 也 正 说 明了 写 unsafe 代 码 的 困难 之 
处 。 许 多 时 候 ， 我 们 的 确 需 要 使 用 unsafe 代 码 来 完成 功能 ， 比 如 调用 C 
代码 写 出 来 的 库 等 。 但 是 却 有 可 能 一 不 小 心 违 反 了 Rust 编 译 器 的 规则 。 
比如 ， 你 没 读 过 上 面 这 段 文档 的 话 ， 不 大 可 能 知道 简单 地 通过 裸 指 针 强 
制 类 型 转换 实现 &T 到 8&mut TT 的 类 型 转换 是 错误 的 。 这 么 做 会 在 编译 右 
的 生命 周期 静态 检查 过 程 中 制造 出 一 个 漏洞 ， 而 且 这 个 漏洞 用 简单 的 测 
试 代码 测 不 出 来 ， 只 有 在 某 些 复杂 场景 下 才 会 导致 内 存 不 安全 。Rust 代 
码 中 写 unsafe 代 码 最 困难 的 地 方 其 实 就 在 这 样 的 细节 中 ， 有 些 人 在 没有 
完全 理解 掌握 Rust 的 safe 代 人 码 和 unsafe 代 人 码 之 间 的 界限 的 情况 下 ， 乱 写 
0 这 是 不 负责 任 的 。 本 书后 面 还 会 有 一 章 专门 讲解 unsafe 关 
子 。 




















第 16 半 ” 解 引 用 


“ 解 引 用 ”(Deref) 是 “ 取 引 用 ”(Ref) 的 反 操 作 。 取 引用 ， 我 们 有 
&、&mnut 等 操作 符 ， 对 应 的 ， 解 引用 ， 我 们 有 * 操 作 符 ， 跟 C 语 言 是 一 
样 的 。 示 例如 下 : 





fn main() { 
let vi = 1; 
let p = &v1; // 取 引用 操作 
let v2 = *p; // 解 引用 操作 
println!i("{} {}", v1, v2); 
} 























比如 说 ， 我 们 有 引用 类 型 p: &i32; ， 那 么 可 以 用 * 符 号 执行 解 引用 
操作 。 上 例 中 ，v1 的 类 型 是 32，p 的 类 型 是 &i32，*p 的 类 型 义 返 回 i32。 


16.1 和 目 定义 解 引用 


解 引 用 操作 可 以 被 自 定义 。 方 法 是 ， 实 现 标准 库 中 的 std: : 
ops: : Deref 或 者 std: : ops: : DerefMut 这 两 个 trait。 


Deref 的 定义 如 下 所 示 。DerefMut 的 唯一 区 别 是 返回 的 是 &mut 型 引 
用 都 是 类 似 的 ， 因 此 不 过 多 介绍 了 。 








pub trait Deref { 

type Target: ?Sized; 

fn deref(&self) -> &Self::Target,; 
} 


pub trait DerefMut: Deref { 
fn deref_ mut(&mut self) -> &mut Self::Target,; 
} 





这 个 trait 有 一 个 关联 类 型 Target， 代 表 解 引用 之 后 的 目标 类 型 。 
比如 ， 标 准 库 中 实现 了 String 同 str 的 解 引用 转换 : 





impl ops::Deref for String { 
type Target = str; 


#[inline] 
fn deref(&self) -> &str { 
unsafe { str::from utf8_ unchecked(&self.vec) } 





请 大 家 注意 这 里 的 类 型 ，deref 〈) 方法 返回 的 类 型 是 &Target， 而 
不 是 Target。 


如 果 说 有 变量 s 的 类 型 为 String，*s 的 类 型 并 不 等 于 s.deref〈) 的 类 


一 


开 ! 


= 
*s 的 类 型 实际 上 是 Target， 即 str。&s*s 的 类 型 才 是 &str。 


s.deref () 的 类 型 为 &Target， 即 &str。 它 们 的 关系 见 表 16-1。 


类 型 
&str 
str 


&str 











以 上 关系 有 点 绕 。 关 键 是 要 理解 ，*expr 的 类 型 是 Target， 而 
deref 〈) 方法 返回 的 类 型 却 是 &Target。 


标准 库 中 有 许多 我 们 常见 的 类 型 实现 了 这 个 Deref 操 作 符 。 比 如 
Vec<T>、String、Box<T>、Rc<T>、Arc<T> 等 。 它 们 都 支持 “ 解 引 用 ” 操 
作 。 从 某 种 意义 上 来 说 ， 它 们 都 可 以 算 做 特种 形式 的 “指针 ”(〈 像 胖 指针 

样 ， 是 带 有 和 额外 元 数据 的 指针 ， 只 是 元 数据 不 限制 在 usize 范 围 内 
了 ) 。 我们 可 以 把 这 些 类 型 都 称 为 “智能 指针 ”。 


比如 我 们 可 以 这 样 理解 这 几 个 类 型 : 
"Box<T> 是 “指针 ”， 指 向 一 个 在 堆 上 分 配 的 对 象 ; 


“Vec<T> 是 “指针 ”， 指 同一 组 同类 型 的 顺序 排列 的 堆 上 分 配 的 对 
象 ， 且 携带 有 当前 缓存 空间 总 大 小 和 元 素 个 数 大 小 的 元 数据 ; 


String 是 “指针 ”， 指 癌 的 是 一 个 堆 上 分 配 的 字 节 数组 ， 其 中 保存 的 
内 容 是 合法 的 utf8 字 符 序 列 。 且 携 融 有 当前 缓存 空间 总 大 小 和 字符 串 实 
际 长 度 的 元 数据 。 


以 上 几 个 类 型 都 对 所 指 同 的 内 容 拥 有 所 有 权 ， 管 理 着 它们 所 指 问 的 
内 存 空间 的 分 配 和 释放 。 


.Rc<T> 和 Arc<T> 也 是 某 种 形式 的 、 携 带 了 额外 元 数据 的 “指针 ”， 
它们 提供 的 是 一 种 “共享 >” 的 所 有 权 ， 当 所 有 的 引用 计数 指针 都 销毁 之 
后 ， 它 们 所 指向 的 内 存 空 间 才 会 被 释 放 。 


目 定义 解 引 用 操作 符 可 以 让 用 户 自 行 定义 各 种 各 样 的 “智能 指针 ”， 
完成 各 种 各 样 的 任务 。 再 配合 上 编译 占 的 “ 目 动 * 解 引用 机 制 ， 非 常 有 
用 。 下 面 我 们 讲解 什么 是 “自动 解 引 用 ”。 


























16.2 ” 目 动 解 引 用 


Rust 提 供 的 “自动 解 引 用 ”机 制 ， 是 在 某 些 场 景 下 “ 隐 式 地 ”自动 
和 什么 是 自动 解 引 用 呢 ? 下 面 用 一 个 示例 来 说 
明 : 














fn main() { 
let s = "hello"; 
println!("length: {}", Ss.len()); 
println!("length: {}", (&s).1len()); 
println!("length: {}", (&&&8888888888S).1len()); 





编译 ， 成 功 。 碍 文档 我 们 可 以 知道 ，len《〈) 这 个 方法 的 签名 是 : 





fn len(&self) -> usize 





它 接受 的 receiver 人 参数 是 &str， 因 此 我 们 可 以 用 UFCS 语 法 调用 : 





println!("length: {}", str::len(&s)); 





但 是 ， 如 果 我 们 使 用 &&&&&r&&&r&&rstr 类 型 来 调用 成 员 方 法 ， 也 
是 可 以 的 。 原 因 就 是 ，Rust 编 译 器 帮 有 我 们 做 了 隐 式 的 deref 调 用 ， 当 它 找 
不 到 这 个 成 员 方 法 的 时 候 ， 会 自动 尝试 使 用 deref 方 法 后 再 找 该 方法 ， 一 
直 循 环 下 去 。 


编译 器 在 &&&str 类 型 里 面 找 不 到 len 方 法 ; 尝试 将 它 deref， 变 成 
&&str 类 型 后 再 寻找 len 方 法 ， 还 是 没 找到 ;继续 deref， 变 成 &str， 现 在 
找到 len 方 法 了 ， 于 是 就 调用 这 个 方法 。 


目 动 deref 的 规则 是 ， 如 果 类 型 T 可 以 解 引 用 为 U， 即 T: Deref<U>， 
则 &T 可 以 转 为 &U。 





16.3 目 动 解 引用 的 用 处 


用 Rc 这 个 “智能 指针 ?举例 。Rc 实 现 了 Deref: 





impl<T: ?Sized> Deref for Rc<T> { 
type Target = T; 


#[inline(always)] 
fn deref(&self) -> &T { 
&self.inner().value 
} 
} 





它 的 Target 类 型 是 它 的 泛 型 参数 T。 这 么 设计 有 什么 好 处 呢 ? 我 们 
看 下 面 的 用 法 : 





USe std::rc::Rc; 


fn main() { 
let s = Rc::new(String::from("hello")); 
println!("{:?}", SsS.bytes()); 





我 们 创建 了 一 个 指 癌 String 类 型 的 Rc 指针 ， 并 调用 了 bytes () 方 
法 。 这 里 是 不 是 有 点 奇怪 ? 


这 里 的 机 制 是 这 样 的 ， Rc 类 型 本 喘 并 没有 bytes〈() 方法 ， 所 以 编 
译 器 会 尝试 自动 deref， 试 试 s.deref () .bytes () 。 


String 类 型 其 实 也 没有 bytes 〈) 方法 ， 但 是 String 可 以 继续 deref， 于 
是 再 试 试 s.deref () .deref () .bytes () 。 


这 次 在 str 类 型 中 找到 了 bytes〈) 方法 ， 于 是 编译 通过 。 


我 们 实际 上 通过 Rc 类 型 的 变量 调用 了 str 类 型 的 方法 ， 让 这 个 智能 指 
针 透 明 。 这 就 是 自动 Deref 的 意义 。 


实际 上 以 下 写法 在 编译 器 看 起 来 是 一 样 的 : 








use std::rc::Rc,; 
use std::ops::Deref,; 


fn main() { 
let s = Rc::new(String::from("hello")); 


println!("length: {}", Ss.1len()); 
println!("length: {}", s.deref().1en()); 
println!("length: {}", s.deref().deref().1len()); 


println!("length: {}", (*s).1len()); 
println!("length: {}", (&*s).1len()); 
println!("length: {}", (&**s).1len()); 





这 就 是 为 什么 String 需 要 实现 Deref trait， 是 为 了 让 &String 类 型 的 变 
量 可 以 在 必要 的 时 候 自 动 转换 为 &str 类 型 。 所 以 String 类 型 的 变量 可 以 
直接 调用 str 类 型 的 方法 。 比 如 : 





let s = String::from("hello"); 
let len = s.bytes(); 





虽然 s 的 类 型 是 String， 但 它 在 调用 bytes 〈) 方法 的 时 候 ， 编 译 器 会 
自动 查找 并 转换 为 s.deref () .bytes〈) 调用 。 所 以 String 类 型 的 变量 就 
可 以 直接 调用 str 类 型 的 方法 了 。 


同 理 : Vec<T> 类 型 也 实现 了 Deref trait， 目 标 类 型 是 [T]，&Vec<T> 
类 型 的 变量 就 可 以 在 必要 的 时 候 自 动 转换 为 &[T] 数 组 切片 类 型 ，Rc<T> 
类 型 也 实现 了 Deref trait， 目 标 类 型 是 IT，Rc<T> 类 型 的 变量 就 可 以 直接 
调用 T 类 型 的 方法 。 


注意 : &* 两 个 操作 符 连 写 跟 分 开 写 古 不 同 的 含义 。 以 下 两 种 写法 
古人 不同 的 : 








fn joint() LA 
let s = Box: :new(String: :new( )); 
let p = &*s 
printin1 (nf{} {}", p, s); 


fn separate() { 
let s = Box::new(String: :new()); 
let tmp = 
let p = &tmp 
ny {}", p, s); 


fn main() { 
joint(); 
separate( ); 








fn joint() 是 可 以 直接 编译 通过 的 ， 而 fn separate () 是 不 能 编译 
通过 的 。 因 为 编译 占 很 聪明 ， 它 看 到 &* 这 两 个 操作 连 在 一 起 的 时 候 ， 
会 直接 把 &*s 表 达 式 理解 为 s.deref() ， 这 时 候 p 只 是 s 的 一 个 借用 而 
己 。 而 如 果 把 这 两 个 操作 分 开 写 ， 会 先 执 行 *s 把 内 部 的 数据 move 出 来 ， 
0 这 时 候 s 已 经 被 移 走 了 ， 生 命 周 期 已 经 结 


同样 的 ，let p=&{*s}; 这 种 写法 也 编译 不 过 。 这 个 花 括号 的 存在 创 
建 了 一 个 临时 的 代码 块 ， 在 这 个 临时 代码 块 内 部 先 执行 解 引 用 ， 同 样 是 


move 语 义 。 


从 这 里 我 们 也 可 以 看 到 ， 默 认 的 “ 取 引 用 ”*”、“ 解 引用 ”操作 古 互补 抵 
消 的 关系 ， 互 为 逆 运 算 。 但 是 ， 在 Rust 中 ， 只 允许 自 定 义 “ 解 引用 ”， 不 
允许 目 定 义 “ 取 引用 ”。 如 果 类 型 有 目 定 义 “ 解 引用 ”， 那 么 对 它 执行 “ 解 
站 的 结果 了 。 先 及 后 * 以 及 先 * 后 && 的 结 

证 个 回 的 。 


16.4 有 时候 需要 手动 处 理 


如 末 智 能 指针 中 的 方法 与 它 内 部 成 员 的 方法 冲突 了 怎么 办 呢 ? 编 译 
器 会 优先 调用 当前 最 匹配 的 类 型 ， 而 不 会 执行 目 动 deref， 在 这 种 情况 
下 ， 我 们 就 只 能 手动 deref 来 表达 我 们 的 需求 了 。 


比如 说 ，Rc 类 型 和 String 类 型 都 有 clone 方 法 ， 但 是 它们 执行 的 任务 
不 同 。Rc: : clone() 做 的 是 把 引用 计数 指针 复制 一 份 ， 把 引用 计数 
加 1。String: : clone〈) 做 的 是 把 字符 串 深 复 制 一 份 。 示 例如 下 : 











use std::rc::Rc; 
use std::ops::Deref; 
fn type_of(_: ()) {} 


fn main() { 
let s = Rc::new(Rc: :new(String::from("hello"))); 


let si1 = s.clone(); // (1) 
//type_of(s1); 

let pS1 = (*s).clone(); // (2) 
//type_of(ps1); 

let pps1i = (**s).clone(); // (3) 
//type_of(pps1); 





在 以 上 的 代码 中 ， 位 置 (1〉 处 s1 的 类 型 为 Rc<Rc<String>>， 位 置 
(2) 处 ps1 的 类 型 为 Rc<String>， 位 置 (3) 处 pps1 的 类 型 为 String。 


一 般 情 况 下 ， 在 函数 调用 的 时 候 ， 编 译 器 会 帮 我 们 尝试 自动 解 引 
用 。 但 在 某 些 情况 下 ， 编 译 器 不 会 为 我 们 自动 插入 自动 解 引用 的 代码 。 
以 String 和 &str 类 型 为 例 ， 在 match 表 达 式 中 : 





fn main() { 
let s = String: :new(); 
match &s { 





这 段 代 码 编译 会 及 生 错 误 ， 错 误 信 息 为 : 





mismatched types : 
expected “&collections: :string::String ， 
found ‘&'static str. 





match 后 面 的 变量 类 型 是 &String， 史 配 分 支 的 变量 类 型 为 &'static 
str， 这 种 情况 下 束 需 要 我 们 手动 完成 类 型 转换 了 。 手 动 将 &String 类 型 
转换 为 &str 类 型 的 办 法 如 下 。 


1) match s.deref () 。 这 个 方法 通过 主动 调用 deref () 方法 达到 类 
型 转换 的 目的 。 此 时 我 们 需要 引入 Deref trait 方 可 通过 编译 ， 即 加 上 代码 


use std: : ops: : Deref; 。 


2) match &*s。 我 们 可 以 通过 *s 运 算 符 ， 也 可 以 强制 调用 deref () 
方法 ， 与 上 面 的 做 法 一 样 。 


3) match s.as_ref () 。 这 个 方法 调用 的 是 标准 库 中 的 std: : 
convert: : AsRef 方 法 ， 这 个 trait 存 在 于 prelude 中 ， 无 须 手 工 引 入 即 可 使 
用 。 


4) match s.borrow () 。 这 个 方法 调用 的 是 标准 库 中 的 std: : 
borrow: : Borrow 方 法 。 要 使 用 它 ， 需 要 加 上 代码 use std: : 
borrow: : Borrow; 。 


5) match &s[..]。 这 个 方案 也 是 可 以 的 ， 这 里 利用 了 String 重 载 的 
Index 操 作 。 


16.5 ”智能 指针 


Rust 语 言 提供 了 所 有 权 、 默 认 move 语 义 、 借 用 、 生 命 周 期 、 内 部 可 
变性 等 基础 概念 。 但 这 些 并 不 是 Rust 全 部 的 内 存 管理 方式 ， 在 这 些 概念 
edd 0 
TT 


16.5.1 引用 计数 


到 目前 为 止 ， 我 们 接触 到 的 示例 中 都 是 一 块 内 存 总 是 只 有 唯一 的 一 
个 所 有 者 。 当 这 个 变量 绑 定 自身 消亡 的 时 候 ， 这 块 内 存 就 会 被 释放 。 引 
用 计数 智能 指针 给 我 们 提供 了 男 外 一 种 选择 ， 一 块 不 可 变 内 存 可 以 有 多 
个 所 有 者 ， 当 所 有 的 所 有 者 消亡 后 ， 这 块 内 存 才 会 被 释放 。 


Rust 中 提供 的 引用 计数 指针 有 std: : rc: : Rc<T> 类 型 和 std: : 
sync: : Arc<T> 类 型 。Rc 类 型 和 Arc 类 型 的 主要 区 别 是 : Rc 类 型 的 引用 
计数 是 普通 整数 操作 ， 只 能 用 在 单线 程 中 ;Arc 类 型 的 引用 计数 是 原子 
操作 ， 可 以 用 在 多 线程 中 。 这 一 点 是 通过 编译 器 静态 检查 保证 的 。Arc 
类 型 的 讲解 可 以 参见 第 四 部 分 相关 章节 ， 本 章 主 要 关注 Rc 类 型 。 


首先 我 们 用 示例 展示 Rc 智能 指针 的 用 法 : 




















use std::rc::Rc; 


struct SharedValue { 
value : i32 


} 


fn main() { 
let shared value : Rc<SharedValue> = Rc: :new(SharedValue { value : 42 }); 


let owner1 = shared value.clone(); 
let owner2 = shared value.clone(); 


println!i("value : {} 人 0}", Owneri.value, owner2.value); 
println!("address : {:p} {:p}", &owneri1.value, &owner2.value); 








$ ./test 
value : 42 42 
address : 0x13958abdf20 0x13958abdf20 


这 说 明 ，ownerl owner2 里 面包 含 的 数据 不 仅 值 是 相同 的 ， 而 且 地 
址 也 是 相同 的 。 这 正 是 Rc 的 意义 所 在 。 


从 示例 中 可 以 看 到 ， Rc 指针 的 创建 是 调用 Rc: : new 静 态 函 数 ， 与 
Box 类 型 一 臻 ee 如 果 要 创建 指向 同样 
内 存 区 域 的 多 个 Rc 指 针 ， 需 要 显 式 调用 Clone 函数 。 请 注意 ，Rc 指 针 是 
没有 实现 Copy trait 的 。 和 如果 使 用 二 接 赋 信 方 式 ， 会 执行 move 语 义 ， 导 
致 前 一 个 指针 失效 ， 后 一 个 指针 开始 起 作用 ， 而 且 引 用 计数 值 不 变 。 如 
果 需 要 创造 新 的 Rc 指 针 ， 必 须 手 工 调用 clone 〈) 函数 ， 此 时 引用 计数 
值 才 会 加 1。 当 某 个 Rc 指 针 失 效 ， 会 导致 引用 计数 值 减 1。 当 引用 计数 值 
减 到 0 的 时 候 ， 共 至 内 存 空间 才 会 被 释放 。 


这 没有 违反 我 们 前 面 讲 的 “内 存 安全 ”原则 ， 它 内部 包 合 的 数据 
是 “不 可 变 的 "， 每 个 Rc 指针 对 它 指 问 的 内 部 数据 只 有 读 功 能 ， 和 共享 引 
用 & 一致， 因此 ， 它 是 安全 的 。 区 别 在 于 ， 共享 引用 对 数据 完全 没有 所 
有 权 ， 不 负责 内 存 的 释放 ， Rc 指 针 会 在 引用 计数 值 减 到 0 的 时 候 释放 内 
存 。Rust 里 面 的 Rc<T> 类 型 类 似 于 C++ 里 面 的 shared_ptr<const T> 类 型 ， 
且 强 制 不 可 为 空 


从 示例 中 我 们 还 可 以 看 到 ， 使 用 Re 访问 被 包含 的 内 部 成 员 时 ， 可 以 
直接 使 用 小 数 点 语法 来 进行 ， 与 T&T Box<T> 类 型 的 使 用 方法 一 样 。 原 
因 我 们 在 前 面 已 经 讲 过 了 ， 这 是 因为 编译 器 帮 我 们 做 了 上 自动 解 引 用 。 我 
们 碍 一 下 Rc 的 源码 就 可 以 知道 : 








impl<T: ?Sized> Deref for Rc<T> { 
type Target = T; 
#[inline(always)] 
fn deref(&self) -> &T { 
&self.inner().value 


} 
} 


可 见 ，Rc 类 型 重 载 了 “ 解 引 用 ”运算 符 ， 而 且 恰 好 Target 类 型 指定 的 
是 T。 这 就 意味 着 编译 器 可 以 将 Rc<T> 类 型 在 必要 的 时 候 自动 转换 为 &T 











类 型 ， 于 是 它 就 可 以 访问 工 的 成 员 变 量 ， 调 用 IT 的 成 员 方法 了 。 因 此 ， 
它 可 以 被 归 类 为 “智能 指针 ?”。 

下 面 我 们 继续 分 析 Rc 类 型 的 实现 原理 。 它 的 源 代码 在 
src/liballoc/rc.rs 中 ，Rc 类 型 的 定义 如 下 所 示 : 








pub struct Rc<T: ?Sized> { 
_ptr: Shared<RcBox<T>>, 
} 





其 中 RcBox 是 这 样 定义 的 : 





struct RcBox<T: ?Sized> { 
strong: Cell<usize>, 
weak: Cell<usize>, 
value: T， 


} 





其 中 Shared 类 型 我 们 暂时 可 以 不 用 管 它 ， 当 它 是 一 个 普通 指针 就 
好 。 目 前 它 还 没有 稳定 ， 后 续 可 能 设计 上 还 会 有 变化 ， 因 此 本 书 就 不 对 
它 深究 了 。 








同时 ， 它 实现 了 Clone 和 Drop 这 两 个 trait。 在 clone 方 法 中 ， 它 没有 
对 它 内 部 的 数据 实行 深 复制 ， 而 是 将 强 引 用 计数 值 加 1， 如 下 所 示 : 





impl<T: ?Sized> Clone for Rc<T> { 


#[inline] 
fn clone(&self) -> Rc<T> { 
self,.inc_strong(); 
Rc { ptr: self.ptr } 
} 
} 


fn inc_strong(&self) { 
self,.inner().strong.set(self,.strong().checked add(1) 
.UnNwrap_or_else(|| unsafe { abort() })); 











在 drop 方 法 中 ， 也 没有 直接 把 内 部 数据 释放 掉 ， 而 是 将 强 引 用 计数 
值 减 1， 当 强 引 用 计数 值 减 到 0 的 时 候 ， 才 会 析 构 掉 共 至 的 那 块 数据 。 妆 
弱 引 用 计数 值 也 减 为 0 的 时 候 ， 才 说 明 没有 任何 Rc/Weak 指 针 指 癌 这 块 





内 存 ， 它 占用 的 内 存 才 会 个 彻底 释放 。 如 下 所 示 : 





unsafe impl<#[may_dangle] T: ?Sized> Drop for Rc<T> { 
fn drop(&mut self) { 
unsafe { 
let ptr = self.ptr.as_ptr(); 


self.dec_strong(); 

If self.strong() == © { 
// destroy the contained object 
ptr::drop_in_place(self.ptr.as_mut()); 


// remove the implicit "strong weak" pointer now that we've 
// destroyed the contents. 
self.dec weak(); 


If self.weak() == 0 { 
Heap.dealloc(ptr as *mut u8, Layout::for_value(&*ptr)); 
} 
} 





从 上 面 代码 中 我 们 可 以 看 到 ，Rc 智 能 指针 所 指向 的 数据 ， 内 部 包含 
了 强 引 用 和 弱 引 用 的 计数 值 。 这 两 个 计数 值 都 是 用 Cell 包 起 来 的 。 为 什 
么 这 两 个 数字 一 定 要 用 Cell 包 起 来 呢 ? 


我 们 假设 ， 如 果 不 用 Cell<usize>， 而 是 直接 用 usize 的 话 ， 在 执行 
clone 方 法 时 会 出 现 什么 情况 。 





fn clone(&self) -> Rc<T> {} 





大 家 需要 注意 的 是 ， 这 个 self 的 类 型 是 &Self， 不 是 &mut Self。 但 我 
们 同时 还 需要 使 用 这 个 共享 引用 self 来 修改 引用 计数 的 值 。 


所 以 这 个 成 员 必须 是 具有 内 部 可 变性 的 。 有 反之， 如果 它 们 是 普通 的 
整数 ， 那 么 我 们 就 要 求 使 用 &mut Self 类 型 来 调用 clone 方 法 ， 然 而 一 般 
情况 下 ， 我 们 都 会 需要 多 个 Rc 指 针 指 回 同 一 块 内 存 区 域 ， 引 用 计数 值 是 
共 至 的 。 如 果 存 在 多 个 &mut 型 指针 指 癌 引用 计数 值 的 话 ， 则 违反 了 Rust 
内 存 安全 的 规则 。 


办 此，Rc 智 能 指针 的 实现 ， 必 须 使 用 “内 部 可 变性 ”功能 。Cell 类 型 
提供 了 一 种 类 似 C++ 的 mutable 关 键 字 的 能 力 ， 使 我 们 可 以 通过 不 可 变 指 








针 修 改 复合 数据 类 型 内 部 的 某 一 个 成 员 变 量 。 


所 以 ， 我 们 可 以 总 结 出 最 适合 使 用 "内 部 可 变性 "的 场景 是 : 当 志 得 
上 不 可 变 的 方法 的 实现 细节 又 要 求 茶 部 分 成 员 变 量具 有 可 变性 的 时 候 ， 
我 们 可 以 使 用 “内 部 可 变性 *。Rc 内 部 的 引用 计数 变量 束 是 绝 佳 的 例子 。 


多 个 Rc 指针 指向 的 共享 内 存 区 域 如 果 需 要 修改 的 话 ， 也 必须 用 内 部 
可 变性 。 如 在 下 面 的 例子 中 ， 如 果 我 们 需要 多 个 Re 指针 指向 一 个 Vec， 
而 且 具 备 修 改 权 限 的 话 ， 那 我 们 必须 用 RefCell 把 Vec 包 起 来 : 











use std:i:rc 
use std: oe Ra 和 人， 


fn main() { 
let shared vec: Rc<RefCell<Vec<isize>>> = Rc::new(RefCell::new(vec![1, 2, 3])); 
let shared1 = shared_vec.clone(); 
let shared2 = sharedi1.clone(); 


shared1.borrow mut().push(4); 
println!("{:?}", shared_vec.borrow()); 


shared2.borrow mut().push(5); 
println!("{:?}", shared_vec.borrow()); 


16.5.2 Cow 


在 C++ 语 境 中 ，Cow 代 表 的 是 Copy-On-Write， 即 “ 写 时 复制 技术 ”。 
它 是 一 种 高 效 的 资源 管理 手段 。 假 设 我 们 有 一 份 比较 昂贵 的 资源 ， 当 我 
们 需要 复制 的 时 候 ， 我 们 可 以 采用 “ 浅 复制 ”的 方式 ， 而 不 需要 重新 克隆 
一 份 新 的 资源 。 而 如 果 要 修改 复制 之 后 的 值 ， 这 时 候 再 执行 深 复制 ， 在 
此 基础 上 修改 。 因 此 ， 它 的 优点 是 把 元 隆 这 个 操作 推迟 到 真正 需要 “ 复 
制 并 写 操作 ”的 时 候 发 生 。 


在 Rust 语 境 中 ， 因 为 Copy 和 Clone 有 比较 明确 的 语义 区 分 ,一般 把 
Cow 和 解释 为 Clone-On-Write。 它 对 指 同 的 数据 可 能 “拥有 所 有 权 ”， 或 者 
可 能 “不 拥有 所 有 权 ”。 


当 它 只 需要 对 所 指 回 的 数据 进行 上 只 读 访 问 的 时 候 ， 它 束 只 是 一 个 借 
用 指针 ; 当 它 需要 写 数 据 功 能 时 ， 它 会 先 分 配 内 存 ， 执 行 复制 操作 ， 再 
对 目 己 拥有 所 有 权 的 内 存 进 行 写 入 操作 。Cow 在 标准 库 中 是 一 个 enum: 




















EE | 


pub enum Cow<'a, B: ?Sized + 'a> where B: ToOwned { 
/// Borrowed data. 
Borrowed(&'a B), 


/// Owned data. 
Owned(<B as ToOwned>: :Owned) 





它 可 以 是 Borrowed 或 者 Owned 两 种 状态 。 如 果 是 Borrowed 状 态 ， 
以 通过 调用 to_mnut 函 数 获取 所 有 权 。 在 这 个 过 程 中 ， 它 实际 上 会 
块 新 的 内 存 ， 并 将 原来 Borrowed 状 态 的 数据 通过 调用 to_owned〈) 方法 
0 的 拥有 所 有 权 的 对 象 ， 然 后 对 这 块 拥有 所 有 权 的 内 存 执 行 
保 作 。 


Cow 类 型 最 常见 的 是 跟 字 符 串 配合 使 用 : 











use std::borrow::Cow; 
fn remove_spaces<'a>(input: &'a str) -> Cow<'a, str> { 
If input.contains(' ') { 
let mut buf = String::with_capacity(input.1len()); 
for c in input.chars() { 
if c != " 
buf .push(c); 
} 


return Cow: :Owned(buf ) ， 


} 
return Cow: :Borrowed(input ) ; 
fn main() { 
let si = "no_spaces_in_string"; 


let result1 = remove_spaces(s1); 


let s2 = "spaces in string"; 
let result2 = remove_spaces(s2); 


println!i("{}\n{}", result1, result2); 








在 这 个 示例 中 ， 我 们 使 用 Cow 类 型 最 主要 的 目的 是 优化 执行 效率 。 
remove_spaces 函 数 的 输入 参数 是 &str 类 型 。 如 果 输 入 的 参数 本 来 就 不 包 
含 空格 ， 那么 我 们 最 好 是 直接 返回 参数 本 身 ， 无 须 分 配 新 的 内 存 ; 如果 
输入 参数 包含 空格 ， 我 们 就 只 能 在 函数 体内 部 创建 一 个 新 的 String 对 


象 ， 用 于 存储 去 除 掉 空 格 的 结果 ， 然 后 再 返回 去 。 


这 样 一 来 ， 束 产生 了 一 个 小 矛盾 ， 这 个 函数 的 返回 值 类 型 用 &str 类 
型 和 String 类 型 都 不 大 合适 。 


:如 条 返回 类 型 指定 为 &str 类 型 ， 那 么 需要 新 分 配 内 存 的 时 候 ， 会 出 
现 生 命 周 期 编译 错误 。 因 为 函数 内 部 新 分 配 的 字符 串 的 引用 不 能 在 函数 
调用 结束 后 继续 存在 。 


-如果 返回 类 型 指定 为 String 类 型 ， 那 么 对 于 那 种 不 需要 对 输入 参数 
做 修改 的 情况 ， 有 一 些 性 能 损失 。 因 为 输入 参数 &str 类 型 转 为 String 类 
型 需要 分 配 新 的 内 存 空间 并 执行 复制 ， 性 能 开销 较 大 。 


这 种 时 候 使 用 Cow 类 型 就 是 不 二 之 选 。 既 能 满足 编译 器 的 生命 周期 


要 求 ， 也 避免 了 无 谓 的 数据 复制 。Cow 类 型 ， 就 是 优秀 的 “ 零 性 能 损失 
抽象 "的 设计 范例 。 








C++implementations obey the zero-overhead principle: What you don’t 
use, you don’t pay for.And further: What you do use, you couldn’t hand 
code any better. 





Stroustrup 


由 于 Rust 中 有 这 套 所 有 权 、 生 命 周期 的 基础 ， 在 Rust 中 使 用 Cow 这 
种 类 型 是 完全 没有 风险 的 ， 任 何 可 能 的 内 存 安全 问题 ， 编 译 堪 都 可 以 帮 
我 们 查 出 来 。 所 以 ， 有 些 时 候 ， 上 自由 和 不 自由 是 可 以 相互 转化 的 ， 语 法 
方面 的 不 自由， 反而 可 能 造就 抽象 水 平 的 更 自由 。 


Cow 类 型 还 实现 了 Deref trait， 所 以 当 我 们 需要 调用 类 型 T 的 成 员 函 
数 的 时 候 ， 可 以 直接 调用 ， 完 全 无 须 考虑 后 面具 体 是 “借用 指针 ”还 
是 “拥有 所 有 权 的 指针 ”。 所 以 我 们 也 可 以 把 它 当 成 是 一 种 “智能 指针 ”。 

















16.6 小结 


Rust 中 人 允许 一 部 分 运算 符 可 以 由 用 户 自 定义 行为 ， 即 “操作 符 重 
载 *。 其 中 “ 解 引 用 ”是 一 个 非常 重要 的 操作 符 ， 它 允许 重 载 。 


而 需要 提醒 大 家 注意 的 是 ,，“ 取 引用 ”操作 符 ， 如 &&、&mut， 是 不 允 
许 重 载 的 。 因 此 ,，“ 取 引用 ”和 “ 解 引用 ”并 非 对 称 互补 关系 。*&T 的 类 型 
一 定 是 T， 而 &*T 的 类 型 未 必 就 是 TT。 


更 重要 的 是 ， 读 者 需要 理解 ， 在 某 些 情况 下 ， 编 译 右 帮 我 们 插入 了 
目 动 deref 的 调用 ， 简 化 代码 。 


在 Deref 的 基础 上 ， 我 们 可 以 封装 出 一 种 自 定 义 类 型 ， 它 可 以 直接 
调用 其 内 部 的 其 他 类 型 的 成 员 方 法 ， 我 们 可 以 把 这 种 类 型 称 为 智能 指针 


类 型 。 











第 17 草 ”泄漏 


熟悉 C++ 的 朋友 应 该 知道 ， 在 C++ 中 ， 如 果 引 用 计数 智能 指针 出 现 
了 循环 引用 ， 就 会 导致 内 存 泄漏 。 而 Rust 中 也 一 样 存在 引用 计数 智能 指 
针 Rc， 那 么 Rust 中 是 否 可 能 制造 出 内 存 泄 漏 呢 ? 


下 面 我 们 来 通过 一 步 步 的 尝试 ， 看 看 如 何 才能 构造 一 个 内 存 泄漏 的 


例子 


17.1 ”内存 泄漏 


首先 ， 我 们 设计 一 个 Node 类 型 ， 它 里 面包 含 一 个 指针 ， 可 以 指向 其 
他 的 Node 实 例 : 





struct Node 
next : Box<Node> 
} 





接 下 来 我 们 尝试 一 下 创建 两 个 实例 ， 将 它们 首尾 相连 : 





fn main() { 
let node1 = Node { next : Box::new(...) } 
} 





到 这 里 写 不 下 去 了 ，Rust 中 要 求 ，Box 指 针 必 须 被 合理 初始 化 ， 而 
初始 化 Box 的 时 候 又 必须 先 传 入 一 个 Node 实 例 ， 这 个 Node 的 实例 又 要 求 
创建 一 个 Box 指 针 。 这 成 了 “ 鸡 生 掉 蛋 生 鸡 ?的 无 限 循环 。 


要 打破 这 个 循环 ， 我 们 需要 使 用 “可 空 的 指针 ”。 在 初始 化 Node 的 时 
候 ， 指 针 应 该 是 ee >， 后 面 再 把 它们 连接 起 来 。 我 们 把 代码 改进 ， 
为 了 能 修改 node 的 值 ， 需要 使 用 mnut: 








Struct Node 
next : Option<Box<Node>> 
} 


fn main() { 
Jet mut node1 = Box::new (Node { next : None }); 
let mut node2 = Box::new (Node { next : None }); 


node1l,next = Some(node2); 
node2 .next = Some(node1); 





编译 ， 发 生 错 误 : “error: use of moved value: `node2`”。 


从 编译 信息 中 可 以 看 到 ， 在 node1.next=Some (node2) ; 这 条 语句 
中 发 生 了 move 语 义 ， 从 此 句 往 后 ，node2 变 量 的 生命 周期 已 经 结束 了 。 


因此 后 面 一 句 中 使 用 node2 的 时 候 发 生 了 错误 。 那 我 们 需要 继续 改进 ， 
不 使 用 node2， 换 而 使 用 nodel.next， 代 码 改 成 下 面 这 样 : 





fn main() { 
Jet mut node1 = Box::new (Node { next : None }); 
let mut node2 = Box::new (Node { next : None }); 


node1l,next = Some(node2); 
match node1.next { 
Some(mut n) => n.next = Some(node1), 
None => {0} 
} 
} 





编译 又 发 生 了 错误 ， 错 误 信 息 为 : “error: use of partially moved 
value: mode1 ”。 


这 是 因为 在 match 语 句 中 ， 我 们 把 nodel.next 的 所 有 权 转 移 到 了 局 部 
变量 n 中 ， 这 个 n 实 际 上 就 是 node2 的 实例 ， 在 执行 赋值 操作 
n.next=Some (nodel1) 的 过 程 中 ， 编 译 器 认为 此 时 node1 的 一 部 分 已 经 被 
转移 出 去 了 ， 它 不 能 再 被 用 于 赋值 号 的 右边 。 


看 来 ， 这 是 因为 我 们 选择 使 用 的 指针 类 型 不 对 ，Box 类 型 的 指针 对 
所 管理 的 内 存 拥 有 所 有 权 ， 只 使 用 Box 指 针 没 有 办 法 构造 一 个 循环 引用 
的 结构 出 来 。 于 是 ， 我 们 想到 使 用 Rc 指 针 。 同 时 ， 我 们 还 用 了 Drop trait 
来 验证 这 个 对 象 是 否 真正 被 释放 了 : 














use std::rc::Rc,; 


struct Node { 
next : Option<Rc<Node>> 
} 


impl Drop for Node { 
fn drop(&mut self) { 
println!("drop"); 


} 


fn main() { 

let mut node1 = Node { next : None }; 
let mut node2 = Node { next : None }; 
let mut node3 = Node { next : None }; 
node1l,next = Some(Rc: :new(node2)); 
node2 .next = Some(Rc::new(node3)); 
node3.next = Some(Rc::new(node1)); 





编译 依然 没有 通过 ， 错 误 信 息 为 : “error: of 
uninitialized structure`"node2`”， 还 是 没有 达到 目的 。 继 续 改 进 ， 我 们 将 
原来 “ 栈 ” 上 分 配 内 存 改 为 在 “ 堆 ”*? 上 分 配 内 存 : 








use std::rc::Rc; 


struct Node { 
next : Option<Rc<Node>> 
} 


impJ Drop for Node { 
fn drop(&mut self) { 
printljn!("drop"); 


} 


fn main() { 
Jet mut nodel 
Jet mut node2 
Jet mut node3 


Rec::new(Node { next : None }); 
Rc::new(Node { next : None }); 
Rc::new(Node { next : None }); 


node1.next 
node2 .next 
node3 .next 


Some(node2 ) ; 
Some(node3); 
Some(node1); 





编译 再 次 不 通过 ， 错 误 信 息 为 : “error: cannot assign to immutable 
field"。 通 过 这 个 错误 信息 ， 我 们 现在 应 该 能 想到 ，Rc 类 型 包含 的 数据 
是 不 可 变 的 ， 通 过 Rc 指针 访问 "ns 必须 用 
RefCell 把 它们 包 囊 起 来 才 可 以 。 继 续 修 改 : 





use std::rc::Rc; 
use std::cell::RefCell; 


struct Node { 
next : Option<Rc<RefCell<Node>>> 


} 
impl Node { 
fn new() -> Node { 
Node { next : None} 
} 
} 


impJ Drop for Node { 
fn drop(&mut self) { 
println!("drop"); 
} 


fn alloc objects() { 


let node1 = Rc: :new(RefCell: :new(Node::new())) 
let node2 = Rc: :new(RefCell: :new(Node: :new())); 
let node3 = Rc: :new(RefCell: :new(Node::new())) 
node1.borrow mut().next = Some(node2.clonel( 
node2.borrow mut().next = Some(node3.clonel( 
node3.borrow mut().next = Some(nodel1.clone( 


} 


fn main() { 
alloc_objects(); 
println!("program finished."); 


} 


了 
了 


了 





因为 我 们 使 用 了 RefCell， 对 Node 内 部 数据 的 修改 不 再 需要 mut 天 键 
字 。 编 译 通 过 ， 执 行 ， 这 一 次 屏幕 上 没有 打印 任何 输出 ， 说 明了 析 构 函 
数 确实 没有 说 调用 。 


至 此 ， 终 于 实现 了 使 用 Rc 指针 构造 循环 引用 ， 制 造 了 内 存 泄漏 。 


本 节 人 花费 这 么 多 笔墨 一 步 步 地 同 大 家 演示 如 何 构造 内 存 泄 漏 ， 主 要 
是 为 了 说 明 ， 虽 然 构 造 循环 引用 非 第 复杂， 但 是 可 能 性 还 是 存在 的 ， 
Rust 无 法 从 根本 上 避免 内 存 泄 漏 。 通 过 循环 引用 构造 内 存 泄漏 ， 需 要 同 
时 满足 三 个 条 件 : 1) 使 用 引用 计数 指针 ，2) 存在 内 部 可 变性 ; 


3) 指针 所 指向 的 内 容 本 喘 不 是 'static 的 。 


当然 ， 这 个 示例 也 说 明 ， 通 过 构造 循环 引用 来 制造 内 存 泄 漏 是 比较 
复杂 的 ， 不 是 轻而易举 就 能 做 到 的 。 构 造 循环 引用 的 复杂 性 可 能 也 刚好 
符合 我 们 的 期 望 ， 毕 竟 从 设计 原则 上 来 说 : 喜 励 使 用 的 功能 应 该 设计 得 
越 易 用 起 好， 不 或 励 使 用 的 功能 ， 应 该 设计 得 越 难 用 越 好 。 





Easy to Use, Easy to Abuse. 
对 于 上 面 这 个 例子 ， 要 想 避 人 免 内 存 泄漏 ， 需 要 程序 员 手 动 把 内 部 菜 


个 地 方 的 Rc 指针 蔡 换 为 std: : rc: : Weak 弱 引用 来 打破 循环 。 这 是 编 
译 吉 无 法 儿 我 们 静态 检查 出 来 的 。 





17.2” 内存 泄漏 属于 内 存 安全 


在 编程 语言 设计 这 个 层面 , “内 存 泄漏 ?是 一 个 基本 上 无 法 在 编译 阶 
段 彻 克 解决 的 问题 。 在 许多 场景 下 ， 什 么 是 “内 存 泄漏 ” 什么 不 是 “内 
存 泄漏 ?， 本 吴 就 没有 一 个 完全 客观 的 评判 标准 。 它 实质 上 跟 程 序 员 
的 “意图 ”有关 。 程 序 很 难 目 动 判定 出 哪些 变量 是 以 后 还 会 继续 用 的 ， 哪 
些 是 不 再 被 使 用 的 。 


即便 是 在 使 用 GC 做 内 存 管理 的 环境 下 ， 程 序 员 也 有 可 能 不 小 心 将 
不 应 该 被 使 用 的 变量 错误 引用 ， 造 成 无 法 自动 回收 的 问题 。 因 为 GC 判 
定 一 个 对 象 是 否 可 回收 的 标准 是 ， 这 个 对 象 有 没有 被 “ 根 ” 对 象 直 接 或 者 
间接 引用 。 假 如 一 个 对 象 本 来 是 应 该 被 释放 的 ， 可 是 因为 逻辑 问题 ， 没 
有 把 指 同 它 的 有 效 引 用 全 部 释放 ， 那 么 GC 依旧 把 它 判 定 为 不 可 回收 。 
我 们 可 能 在 不 经 意 的 情况 下 ， 造 成 了 不 再 需要 继续 使 用 的 对 象 被 生命 周 
期 更 长 的 对 象 所 引用 。 面 对 这 样 的 情况 ，GC 也 会 显得 无 能 为 力 。 比 
如 ， 在 android 编 程 领域 ， 我 们 可 能 会 在 注册 回调 函数 的 时 候 把 一 个 较 大 
的 activity 引 用 传递 过 去 ， 结 果 activity 应 该 被 销毁 的 时 候 ， 由 于 还 有 其 他 
变量 继续 持 有 指 辐 它 的 引用 ， 从 而 导致 该 activity 变 量 无 法 正常 被 释放 ， 
这 种 现象 被 称 为 “Context 汇 漏 ?。 解 诀 这 个 问题 的 办 法 只 能 是 ， 在 必要 的 
地 方 使 用 “ 弱 引 用 ”(Weak Reference) ， 避 免 “ 强 引用 ”对 变量 生命 周期 
的 影响 。 解 决 引 用 计数 的 循环 引用 的 办 法 与 此 类 似 ， 也 是 一 样 用 * 弱 引 
用 ”来 打破 循环 ， 避 人 免 “ 强 引 用 ”对 生命 周期 的 影响 。 再 比如 在 javascript 
中 注册 一 个 定时 器 ， 而 定时 器 不 小 心 引 用 了 许多 大 对 象 ， 这 些 对 象 会 随 
着 闭 包 加 入 到 主事 件 循环 队列 中 ， 也 会 造成 类 似 的 结果 。 在 绝 大 部 分 情 
况 下 ，GC 给 我 们 带 来 了 方便 。 但是， 程序 员 也 干 万 不 能 因为 有 GC 的 辅 
助 ， 而 忽略 对 变量 的 生命 周期 的 设计 考量 。 


在 C++ 和 Rust 中 是 一 样 的 ， 如 果 出 现 了 循环 引用 ， 那 么 只 能 通过 手 
动 打 破 循 环 的 方式 来 解决 内 存 泄漏 的 问题 。 编 译 右 无 法 通过 静态 检查 来 
保证 你 不 会 犯 这 个 错误 。 


内 存 泄 漏 显 然 是 一 种 bug。 但 它 跟 “内 存 不 安全 ”这 种 bug 的 性 质 不 一 
样 。“ 内 存 泄漏 ?是 对 “正常 数据 ”的 “应 该 执行 但 是 没有 执行 ”的 操作 , “内 
存 不 安全 ”是 对 “不 正常 数据 ”的 “不 应 该 执行 但 是 执行 了 ”的 操作 。 从 后 
0 “内 存 不 安全 ”导致 的 后 果 比 “内 存 泄漏 "要 严重 得 多 ， 如 表 17-1 
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不 正常 数据 


执行 了 / 内 存 不 安全 
没 执 行 内 存 泄漏 





语言 的 设计 者 当然 是 希望 能 彻底 解决 内 存 泄漏 的 问题 。 但 是 很 可 
异 ， 这 个 问题 丸 怕 不 是 在 语言 层面 能 彻底 解决 的 问题 。 所 谓 “ 彻 底 解 
决 ” 的 意思 是 ， 用 户 无 论 使 用 何 种 技巧 ， 永 远 无 法 构造 出 内 存 泄 漏 的 情 
况 。Rust 语 言 无 法 给 出 这 样 的 保证 。 笔 者 也 不 认为 GC“ 彻 底 解决 "了 内 
存 泄漏 的 问题 。 内 存 泄 漏 当 然 是 不 好 的 事情 ， 作 为 开发 者 ， 我 们 应 该 尺 
可 能 避免 内 存 泄 漏 现象 的 发 生 。 然 而 ， 需 要 强调 的 是 ， 内 存 泄漏 不 属于 
Rust 也 不 会 在 语言 设计 层面 给 出 一 个 “免除 内 存 泄 
漏 ? 以 承诺 。 


To put it another way, Rust gives you a lot of safety guarantees, but it 
doesn’t protect you from memory leaks (or deadlocks, which turns out to 
be a very similar problem) . 


17.3” 析 构 函数 泄漏 


上 面 的 例子 展现 了 如 何在 Rust 中 不 使 用 unsafe 代 码 制 造 内 存 泄漏 。 
在 Rust 中 ， 在 不 经 意 间 不 小 心 制造 内 存 泄漏 的 可 能 性 是 很 低 的 。 但 是 这 
个 可 能 性 还 是 存在 的 。 


然而 ， 内 存 泄漏 并 非 最 可 怕 的 情况 ， 因 为 内 存 泄漏 只 造成 资源 浪 
费 ， 毕 竟 没 有 造成 时 指针 等 更 为 严重 的 内 存 安全 问题 。 上 面 的 例子 实际 
上 还 暗示 了 另外 一 种 危险 性 ， 即 析 构 函数 泄漏 。 在 Rust 中 ，RAII 手 法 用 
得 非常 普遍 ， 它 实际 上 要 求 程序 的 正确 性 依赖 于 析 构 函数 的 确定 性 调 
用 。 然 而 让 我 们 担心 的 事情 是 ， 析 构 函数 是 有 可 能 永远 不 会 被 调用 的 。 


除了 前 面 展 示 的 通过 循环 引用 导致 的 析 构 函数 泄漏 之 外 ， 还 有 许多 
种 方式 可 以 产生 同样 的 效果 。 比 如 ， 我 们 构造 两 个 首尾 相连 的 channel， 
发 送 端 和 接收 闯 连 到 一 起 ， 那 么 在 这 两 个 channel 里 面 传递 的 对 象 就 进入 
了 死人 循环 ， 就 永远 不 会 被 析 构 了 。 


析 构 函数 泄漏 是 比 内 存 泄 漏 更 严重 的 情况 。 因 为 析 构 函数 是 可 
以 “ 自 定义 ”的 ， 析 构 函 数 里 面 可 能 调用 “任意 的 ”代码 。 


我 们 一 直 在 强调 ，Rust 给 了 我 们 一 个 非常 强 的 保证 ， 即 “内 存 安 
全 ”。 这 个 保证 是 非常 严肃 认真 的 。 这 个 保证 意味 着 ， 只 要 不 使 用 
unsafe， 用 户 永远 无 法 构造 出 内 存 不 安全 ”的 情况 。 然 而 ， 对 于 泄漏 问 
题 ，Rust 做 不 到 像 内 存 安全 这 种 程度 的 保证 。 所 以 ，Rust 设 计 者 不 得 不 
痛苦 地 承认 ， 析 构 函 数 并 不 能 被 保证 调用 。 大 家 不 要 误解 了 这 段 话 ， 这 
并 不 是 意味 着 Rust 会 轻 轻松 松 、 时 时 刻 刻 造成 泄漏 ， 它 只 是 意味 着 ， 编 
译 器 没 办 法 自动 检查 出 所 有 可 能 的 资源 洪 漏 问题， 并 给 出 编译 错误 或 区 
柯 o 























承认 析 构 函数 可 能 不 会 被 调用 (即便 在 不 使 用 unsafe 代 码 情况 
下 ) ， 并 不 会 造成 特别 严重 的 问题 “除非 它 违反 了 “内 存 安全 "。* 内 
存 安全 ”一 直 是 Rust 坚 持 的 原则 和 底线 ， 这 条 原则 是 永远 不 能 被 破坏 
的 ， 否 则 Rust 就 失去 了 存在 的 意义 。 这 个 结论 直接 导致 了 下 面 几 个 比较 
重要 的 后 果 。 


其 一 ， 标 准 库 中 的 std: : mem: : forget 函 数 去 掉 了 unsafe 标 记 。 














其 二 ， 人 允许 带 有 析 构 函数 的 类 型 ， 作 为 static 变 量 和 const 变 量 。 全 
局 变量 的 白板 函数 最 局 是 洪 沁 拉 了 的 不 会 被 调用 。 以 前 曾经 规定 带 析 
， 数 的 类 型 不 允许 作为 全 局 变量 ， 后 来 放宽 了 规定 ， 人 允许 作为 全 局 变 

， 但 是 析 构 函数 无 法 调用 。 


其 三 ， 标 准 库 中 不 安全 代码 需 要 依赖 析 构 函数 调用 的 逻辑 得 到 修 
改 ， 其 中 涉及 Vec: : drain_range 和 Thread: : scoped 等 方法 。 


Rust 标 准 库 中 有 一 个 std: : mem: : forget 函 数 ， 这 个 方法 的 签名 
是 fn forget<T> (t: T) 。 它 接受 的 参数 不 是 引用 类 型 ， 而 是 将 参数 
move 进 入 函数 体 中 ， 类 似 于 std: : mem: : drop。 但 它 与 drop 最 大 的 区 
别 是 ， 它 会 阻止 编译 占 调 用 这 个 变量 的 析 构 函数 ， 也 不 会 释放 它 在 堆 上 
申请 的 内 存 。 它 的 作用 就 是 制造 泄漏 。 原 来 这 个 函数 是 unsafe 的 ， 但 
是 ， 当 设计 者 发 现 完 全 可 以 用 安全 代码 写 一 个 同样 效果 的 forget 函 数 ， 
那么 ， 它 的 unsafe 标 记 也 就 没有 什么 意义 了 。 因 此 ， 大 家 决定 ， 去 挥 
forget 函 数 前 面 的 unsafe 标 记 。 这 个 函数 不 再 被 标记 为 unsafe， 只 是 因为 
设计 者 意识 到 了 泄漏 并 非 内 存 安 全 问题 ，unsafe 关 键 字 只 能 用 于 标记 跟 
内 存 安 全 相关 的 问题 ， 并 非 意味 着 喜 励 用 户 随 意 使 用 这 个 函数 。 那 么 它 
有 什么 用 呢 ? 我 们 可 以 举 几 个 例子 : 


:我们 有 一 个 未 初始 化 的 值 ， 我 们 不 希望 它 执行 析 构 函数 ; 
.在 用 FFI 跟 外 部 函数 打交道 的 时 候 。 


即便 析 构 函数 泄漏 ， 也 不 应 造成 内 存 不 安全 。 这 个 绪论， 直接 导致 
了 thread: : scoped 函 数 从 标准 库 中 移 除 。scoped 函 数 是 这 样 设 计 的 : 
scoped 函 数 可 以 创建 一 个 线程 ， 跟 spawn 函 数 不 一 样 ， 它 保证 在 当前 函 
数 退 出 以 前 ， 这 个 线程 必定 已 经 退出 。 这 样 一 来 ， 我 们 就 可 以 直接 使 用 
引用 && 来 读 父 线程 读 局 部 变量 ， 或 者 用 &mnut 来 写 局 部 变量 ， 避 免 了 Arc 
的 运行 效率 损失 ， - 常 有 用 的 scoped 也 数 与 spawn 函 数 的 区 别 就 在 
于 ， 它 保证 子 线程 一 定 会 在 当前 函数 退出 之 前 退出 ， 所 以 它 的 生命 周期 
比 当前 函数 的 生命 周期 写 ， 





























// 以 下 示例 目前 无 法 编译 通过 , scoped 已 经 被 移 除 
use std::thread; 
































fn main() { 
let mut vec = vec![90, 1, 2, 3, 4, 5, 6, 7]; 


let mut guards = Vec: :new(); 


for x in &mut vec { 
let guard = thread::scoped(move || { 
*x 村 


ee 
guards.push(guard); 
} 
// guards 析 构 ,在 析 构 函数 中 等 待 子 线程 被 销毁 








} 
// 子 线程 已 经 全 部 退出 
println!("{:?}", vec); 














这 个 scoped 函 数 的 实现 原理 是 ， 它 返回 一 个 JoinGuard 类 型 ， 在 这 个 
类 型 的 析 构 函数 中 阻塞 当前 线程 ， 等 待 子 线程 结束 。 所 以 ， 函 数 退 出 之 
前 ， 子 线程 必定 已 经 被 销毁 。 子 线程 中 用 到 的 指 癌 当前 函数 栈 的 指针 ， 
也 不 会 成 为 野 指 针 。 


粗 看 起 来 以 上 这 个 设计 是 不 错 的 ， 而 且 它 也 的 确 在 早期 版 本 的 Rust 
标准 库 中 存在 了 一 段 时 间 。 然 而 可 惜 的 是 ， 这 个 设计 是 有 bug 的 ， 它 会 
造成 安全 代码 中 的 “内 存 不 安全 ”现象 。 问 题 在 哪里 呢 ? 问题 在 于 “ 析 构 
函数 泄漏 ?。 我 们 知道 ，Rust 无 法 保证 “ 析 构 函数 必定 被 调用 ”。 如 果 有 一 
个 用 户 ， 想 办 法 将 这 个 JoinGuard 传 递 到 当前 函数 外 面 去 了 ， 或 者 用 循环 
引用 使 得 这 个 类 型 的 析 构 函数 永 不 调用 ， 融 出 现 了 析 构 汇 漏 。 如 果 这 个 
类 型 出 现 了 析 构 泄漏 ， 那 么 会 导致 这 个 子 线程 的 生命 周期 并 不 会 限制 在 
父 线程 的 当前 函数 执行 周期 之 内 ， 父 线程 的 当前 函数 退出 ， 子 线程 却 并 
未 结束 ， 父 线程 的 函数 调用 栈 已 经 发 生变 化 ， 而 子 线程 依然 有 能 力 访 问 
以 前 指 辣 的 那 块 内 存 。 这 是 一 个 典型 的 内 存 安 全 问题 。 


Rust 对 “内 存 安全 ”是 不 允许 的 。 虽 然 上 面 叙述 的 情况 在 正式 代码 中 
出 现 的 几率 很 小 ， 但 是 这 依旧 是 一 个 潜在 的 问题 。Rust 对 库 代 码 的 质量 
标准 是 : 不 论 使 用 何 种 奇 巧 ， 只 要 用 户 有 可 能 在 不 使 用 unsafe 构 造 出 内 
存 安全 ， 那 这 个 库 就 是 不 安全 的 、 不 可 接受 的 。 因 此 ，scoped 函 数 必须 
从 标准 库 中 去 控 ， 它 是 不 能 被 接受 的 。 它 违反 了 Rust 的 安全 承诺 ， 将 安 
全 性 建立 在 “ 析 构 函数 必定 被 调用 ”的 假设 之 上 ， 而 这 个 假设 是 不 成 芯 
的 。 它 有 可 能 导致 不 使 用 unsafe 的 情况 下 ， 也 能 制造 出 “内 存 不 安全 ”。 
这 是 一 个 设计 失败 的 API。 


那么 用 什么 办 法 来 解雇 这 个 问题 呢 ? 可 以 通过 改变 API 的 风格 来 实 
现 。 如 果 说 RAII 式 的 风格 是 外 癌 式 的 ， 那 么 对 应 的 “回调 函数 ” 式 的 风格 
就 是 内 向 式 的 。 什 么 是 外 向 式 的 和 内 癌 式 的 API 风 格 ? 我 们 拿 欠 代 器 来 
打 比 方 。Rust 的 迭代 器 是 典型 的 外 癌 式 的 风格 ， 它 暴露 了 next () 方 














法 ， 由 使 用 者 决定 何 时 、 何 处 、 如 何 调 用 。 我 们 还 可 以 设计 内 同 式 的 迭 
代 风 格 ， 它 的 写法 是 for_each (||{this is a closure} ) 。 在 这 种 方式 下 ， 使 
用 者 只 能 传递 一 个 财 包 进去 ， 而 无 权 管 理 迭 代 器 的 调用 。 内 辐 式 的 API 
对 使 用 者 来 说 灵活 性 就 比较 甜 ， 比 如 ， 我 们 没 办 法 实现 针对 两 个 容器 的 
两 个 运 代 器 ， 分 别 轮流 调用 next 〈) 方法 ， 或 者 在 迭代 过 程 中 提前 中 止 








相 比 之 下 ，RAII 陈 的 API 骏 露 给 使 用 者 的 灵活 性 更 强 ， 而 回调 函数 
式 的 API 对 使 用 者 的 约束 性 更 强 。 我 们 如 果 把 scoped 函 数 变 一 种 风格 ， 
它 就 可 以 变 成 安全 的 了 。 这 个 尝试 ， 在 第 三 方 库 中 己 经 实现 ， 如 果 大 家 
需要 这 个 功能 ， 可 以 搜索 crossbeam 或 者 scoped_threadpool 这 两 个 库 。 我 
们 来 看 看 scoped_threadpool 是 如 何 使 用 的 : 








extern crate scoped_ threadpool; 
use scoped_ threadpool: :PooJl， 


fn main() 
let mut pool = Pool: :new(4); 


let mut vec = vec![90, 1, 2, 3, 4, 5, 6, 7]; 
pool.scoped(|scope|l { 
e in &mut vec { 
scope.execute(move || { 
*e += 1; 
}); 


} 
}); 


println!("{:?}", vec); 





关于 如 何 利用 cargo 工 其 引用 外 部 库 ， 在 本 章 束 不 详细 解释 了 。 在 
这 里 我 们 只 关心 代码 逻辑 。 线 程 内 部 直接 使 用 了 &mut vec 形 式 访问 了 父 
线程 “ 栈 * 上 的 变量 。 这 个 scoped 函 数 的 使 用 方式 跟前 面 介绍 的 版 本 相 比 
更 复杂 ; 然而 ， 它 的 优点 古 安全 性 并 不 依赖 外 部 使 用 者 确保 “ 析 构 函 
数 ?的 调用 。 因 为 这 个 改变 ， 使 得 “等 竺 线程 结束 ”这 个 多 辑 从 库 的 使 用 
者 那 边 移 动 到 了 库 的 编写 者 那 边 。 库 的 编写 者 当然 可 以 保证 这 个 逻辑 必 
然 被 调用 ， 如 果 我 们 把 它 暴 露出 来 ， 交 给 使 用 者 来 调用 ， 束 不 一 定 了 。 
所 以 说 ， 我 们 能 从 中 学 到 的 一 点 是 : 当 你 写 一 个 库 的 时 候 ， 如 果 和 希望 能 
确保 某 个 方法 一 定 会 被 调用 ， 请 保证 这 上 段 代码 在 你 自己 的 控制 之 中 ， 不 
要 只 在 文档 中 描述 ， 要 求 使 用 者 主动 去 调用 。 











我 们 比较 一 下 scoped 函 数 和 spawn 函 数 的 签名 规则 : 





fn scoped<'pool, 'scope, F, R>(&'pool mut self, f: F) -> R 
where F: FnOonce(&Scope<'pool, 'scope>) -> R 


{} 
fn spawn<F, T>(f: F) -> JoinHandle<T> 
where F: Fnonce() -> T, F: Send + 'static, T: Send + 'static 





我 们 可 以 看 到 ， 对 于 闭 包 参 数 F 类 型 的 约束 ，spawn 有 'static 生 命 周 
期 限制 ， 而 scoped 无 需 'static 生 命 周 期 限制 。 之 所 以 有 这 样 的 区 别 ， 原 因 
就 是 在 scoped 的 内 部 实现 中 保证 了 子 线程 一 定 会 在 父 线 程 当前 函数 退出 
前 结束 ， 这 个 约束 条 件 不 是 随便 能 修改 的 。 在 它们 的 内 部 都 使 用 了 
unsafe 代 码 作 为 实现 细节 ， 在 它们 的 外 部 都 使 用 了 合理 的 约束 条 件 来 保 
证 线程 安全 。 所 以 我 们 需要 再 向 大 家 提醒 一 下 safe 和 unsafe 的 边界 究竟 
在 哪里 。 哪 些 是 编译 器 可 以 保证 的 ， 哪 些 是 编译 器 无 法 保证 的 ， 不 是 简 
单 束 说 得 清楚 的 事情 。 干 万 不 要 自以为是 地 小 用 unsafe， 如 果 雄 圳 的 外 
部 接口 和 内 部 实现 不 匹配 ， 就 会 给 下 游 用 户 “ 控 坑 ”， 很 容易 导致 某 些 初 
学 者 误 以 为 Rust 的 内 存 安 全 保证 是 骗 人 的 。 


泄漏 是 一 个 肤 烦 的 问题 ，Rust 在 这 个 问题 上 的 设计 涉及 许多 的 受 协 
和 平衡 ， 其 间 引 及 了 大 量 的 纠结 、 讨 论 甚至 争吵 。 正 是 : 


曾 外 多情 损 梵 行 ， 
入 山 义 恐 别 倾城 。 
世间 安 得 双全 法 ， 
不 负 如 来 不 负 卿 。 

















第 18 瘟 ”Panic 


18.1 什么 是 panic 


在 Rust 中 ， 有 一 类 错误 叫 作 panic。 示 例如 下 : 





fn main() { 
let x : Option<i32> = None,; 
x.unwrap( ); 





编译 ， 没 有 错误 ， 执 行 这 段 程序 ， 输 出 为 : 





thread '<main>' panicked at 'called ‘Option::unwrap() on a None”Vvalue'，,,/Src/J]1j 
note: Run with “RUST_BACKTRACE=1 for a backtrace. 





这 种 情况 就 引发 了 一 个 panic。 在 这 段 代码 中 ， 我 们 调用 了 
Option: : unwrap() 方法 ， 正 是 这 个 方法 有 可 能 导致 panic。 根 据 提 
示 ， 我 们 设置 一 个 环境 变量 RUST_BACKTRACE=1 之 后 再 执行 这 个 程 
序 ， 可 以 看 到 这 个 程序 在 发 生 panic 时 候 的 函数 调用 栈 。 


执行 RUST BACKTRACE=1./test， 结 果 为 : 








thread 'main' panicked at 'called ‘Option::unwrap() on a ‘None value', ../src/libc 
stack backtrace: 

1: 0x10af488f8 - std::sys::backtrace::tracing::imp::write::h6f1id53a70916b9Qd 
2: Ox1l0af4a3af - std::panicking::default_ hook::{{closure}}::h1i37e876f7d3b5850 
3: Ox1l0af49945 - std::panicking::default_hook: :hoac3811ec7cee78c 

4: 0x10af49e96 - std::panicking::rust_ panic with hook::hc303199e04562edf 

5: 0x10af49d34 - std::panicking::begin_panic::h6ed03353807cf54d 

6: 0x10af49c52 - std::panicking::begin panic fmt::hc321cece241bb2f5 

7: Ox1l0af49bb7 - rust_begin unwind 

8: 0x10af6f0b0 - core::panicking::panic_fmt::h27224b181f9f037f 

9: 0x10af6efb4 - core::panicking::panic::h53676c30b3bd95eb 

10: 0Xx10af44804 - <core::option::0ption<T>>: :unwrap::h3478e42c3c27faa3 

11: 0Xx10af44880 - test::main::h8a7ra35fa594c0174 

12: Oxi0af4a96a - rust_maybe_catch_panic 

13: 0Xx10af49486 - std::rt::lang_ start::h538f8960e7644c80 

14: 0Xx10af448b9 - main 





一 =i 


我 们 去 查 一 下 Option: : unwrap〈) 的 文档 ， 其 中 是 这 么 说 的 : 





Moves the value v out of the Option<T> if it is Some(v)， 

Panics 
Panics if the self value equals None. 

Safety note 
In general, because this function may panic, its use is discouraged. 
Instead, prefer to use pattern matching and handle the None case explicitly. 





当 Option 内 部 的 数据 是 Some 时 ， 它 可 以 成 功 地 将 内 部 的 数据 move 
出 来 返回 。 


当 Option 内 部 的 数据 是 None 时 ， 它 会 发 生 panic。panic 如 果 没 有 被 
处 理 ， 它 会 导致 整个 程序 朋 泪 。 


在 Rust 中 ， 正 常 的 错误 处 理应 该 尽量 使 用 Result 类 型 。Panic 则 是 作 
为 一 种 “fail fast* 机 制 ， 人 处 理 那 种 万 不 得 已 的 情况 。 


比如 ， 上 面 例子 中 的 unwrap 方 法 ， 试 图 把 Option<i32> 转 换 为 132 类 
型 ， 当 参数 是 None 的 时 候 ， 这 个 转换 是 没 办 法 做 到 的 ， 这 种 时 候 就 只 能 
使 用 panic。 所 以 ， 一 般 情 况 下 ， 用 户 应 该 使 用 unwrap_or 等 不 会 制造 
panic 的 方法 。 





18.2 ”Panic 实 现 机 制 


在 Rust 中 ，Panic 的 实现 机 制 有 两 种 方式 unwind 和 abort。 


unwind 方式 在 发 生 panic 的 时 候 ， 会 一 层 一 层 地 退出 函数 调用 栈 ， 
在 此 过 程 中 ， 当 前 栈 内 的 局 部 变量 还 可 以 正常 析 构 。 

:abort 方 式 在 发 生 panic 的 时 候 ， 会 直接 退出 整个 程序 。 

在 常见 的 操作 系统 上 ， 默 认 情况 下 ， 编 译 器 使 用 的 是 nwind 方 式 。 
所 以 在 发 生 panic 的 时 候 ， 我 们 可 以 通过 一 层 层 地 调用 栈 找到 发 生 panic 
的 第 一 现场 ， 就 像 前 面 例子 展示 的 那样 。 

但 是 ，unwind 并 不 是 在 所 有 平台 上 都 能 获得 恨 好 文 持 的 。 在 某 些 蔡 
入 式 系统 上 ，unwind 根 本 无 法 实现 ， 或 者 占用 的 资源 太 多 。 在 这 种 时 
候 ， 我 们 可 以 选择 使 用 abort 方 式 实现 panic。 


编译 如 提供 了 一 个 选项 ， 供 用 户 指 定 panic 的 实现 方式 。 如 下 所 示 : 




















rustc -C panic=unwind test,rs 
rustc -C panic=abort test.rs 


读者 可 以 试 试 上 面 两 个 编译 命令 ， 做 一 下 对 比 。 可 以 看 到 它们 生成 
的 代码 ，panic 时 的 行为 是 不 一 样 的 ， 生 成 的 可 执行 程序 大 小 也 不 同 。 

Rust 中 ， 通 过 unwind 方 式 实现 的 panic， 其 内 部 的 实现 方式 基本 与 
C++ 的 异常 是 一 样 的 。 而 且 ，Rnust 提 供 了 一 些 工 具 函 数 ， 可 以 让 用 户 在 
代码 中 终止 栈 展开 。 示 例如 下 : 








use std::panic; 


fn main() { 
panic::catch_ unwind(|| { 
let x : Option<i32> = None,; 
x.unwrap( ); 
println!("interrupted."); 


}).ok(); 


println!("continue to execute."); 





编译 执行 可 见 ， 在 unwrap 语 名 后面 的 这 条 打印 语句 并 未 执行 。 因 为 
在 上 一 条 语句 中 触发 了 panic， 这 个 函数 调用 栈 开 始 销毁 。 但 是 我 们 有 一 
句 catch_unwind 阻 止 了 函数 调用 栈 的 继续 展开 ， 束 像 C++ 里 面 的 try-catch 
Ne 因此 ，main 方 法 并 没有 继续 被 销毁 ， 最 后 那 条 语句 可 以 正常 
本 印 输出 。 


如 果 我 们 尝试 使 用 “-C panic=abort” 选 项 编译 上 面 的 代码 ， 可 以 看 到 
这 个 catch_unwind 起 不 了 什么 作用 ， 最 后 那 条 语句 无 法 正常 打印 输出 。 


但 是 ， 请 大 家 注意 ， 这 个 catch_unwind 机 制 绝 对 不 是 设计 用 于 模 
拟 “try-catch” 机 制 的 。 请 大 家 永远 不 要 利用 这 个 机 制 来 做 正常 的 流程 控 
制 。Rust 推 荐 的 错误 处 理 机 制 是 用 返回 值 ， 第 33 章 讲解 Rust 的 错误 处 理 
机 制 。panic 出 现 的 场景 一 般 是 : 如 果 继 续 执 行 下 去 就 会 有 极其 严重 的 内 
存 安全 问题 ， 这 种 时 候 让 程序 继续 执行 导致 的 危害 比 戎 泪 更 严重 ， 此 时 
panic 就 是 最 后 的 一 种 错误 处 理 机 制 。 它 的 主要 用 处 参考 下 面 的 情况 : 


:在 FFI 场 景 下 的 时 候 ， 当 C 语 言 调用 了 Rust 的 函数 ， 在 Rust 内 部 出 现 
了 panic， 如 果 这 个 panic 在 Rust 内 部 没有 处 理 好 ， 直 接 扔 到 C 代 码 中 去 ， 
会 导致 C 语 言 产 生 “ 未 定义 行为 ”(Cundefined behavior) 。 


某 些 局 级 抽象 机 制 需 要 阻止 栈 展开 ， 比 如 线程 池 。 如 果 一 个 线程 
中 出 现 了 panic， 我 们 希望 只 把 这 个 线程 关闭， 而 不 至 于 将 整个 线程 
闻 “ 拖 下 水 ”。 











18.3 Panic Safety 


C++ 中 引入 了 "异常 ?这 个 机 制 之 后 ， 同 时 也 带 入 了 一 个 “异常 安 
全 ”(exception safety) 的 概念 。 对 这 个 概念 不 熟悉 的 读者 ， 建 议 阅读 以 
下 文档 : 

http://www.stroustrup.com/except.pdf 


异常 安全 存在 四 种 层次 的 保证 : 


No-throw 一 一 这 种 层次 的 安全 性 保证 了 所 有 的 异种 都 在 内 部 正确 
处 理 完 毕 ， 外 部 坚 无 影响 ; 




















“Strong exception safety 一 一 强 异 常安 全 保证 可 以 保证 异常 发 生 的 时 
修 ， 所 有 的 状态 都 可 以 “ 回 深 ” 到 初始 状态 ， 不 会 导致 状态 不 一 致 的 问 


题 ; 





基本 异常 安全 保证 可 以 保证 异常 发 生 的 





‘Basic exception safety 


时 候 不 会 导致 资源 泄漏 ; 
.No exception safety 一 一 没有 任何 异常 安全 保证 。 


当 我 们 在 系统 中 使 用 了 “异常 * 的 时 候 ， 就 一 定 要 想 清楚 ， 每 个 组 件 
应 该 提供 哪 种 层级 的 异常 安全 保证 。 在 Rust 中 ， 这 个 问题 同样 存在 ， 但 
是 一 般 叫 作 panic safety， 与 “异常 ”说 的 是 同一 件 事 情 。 


下 面 我 们 来 用 代码 来 示例 “异常 安全 ”问题 会 如 何 影 响 我 们 的 代码 实 
现 。 这 次 ， 我 们 用 标准 库 中 的 一 段 代 码 来 演示 。 下 面 的 代码 是 从 
src/liballoc/boxed.rs 中 复制 出 来 的 ，clone () 方法 目的 是 复制 一 份 新 的 
Box<[T]>: 














impl<T: Clone> Clone for Box<[T]> { 
fn clone(&self) -> Self { 
let mut new = BoxBuilder { 
data: RawVec: :with capacity(self.1len()), 
len: 0, 
}; 


let mut target = new.data.ptr(); 


for item in self.iter() { 
unsafe { 
ptr::write(target, item.clone()); 
target = target.offset(1); 


了 


new.len += 1; 


} 


return unsafe { new.into_box() }; 


// Helper type for responding to panics correctly. 
struct BoxBuilder<T> { 

data: RawVec<T>, 

len: usize, 


} 


impl<T> BoxBuilder<T> { 
unsafe fn into box(self) -> Box<[T]> { 
let raw = ptr::read(&self.data); 
mem: :forget(self); 
raw.into_box() 
} 
} 


impl<T> Drop for BoxBuilder<T> { 
fn drop(&mut self) { 
let mut data = self.data.ptr(); 
let max = unsafe { data.offset(self.len as isize) }; 


while data != max { 
unsafe { 
ptr::read(data); 
data = data.offset(1); 
} 
} 
} 





这 段 代 码 的 实现 稍微 有 点 复杂 ， 但 是 逻辑 还 是 很 清楚 的 。 我 们 可 以 
先 不 考虑 标准 实现 ， 先 想 想 如 果 我 们 目 己 来 实现 会 怎么 做 。 要 clone () 
一 份 Box<[T]>， 束 要 新 分 配 一 份 内 存 空间 ， 循 环 把 每 个 元 素 clone 〈 ) 
一 裔 即 可 。 有 个 小 技巧 是 ， 构 造 Box<[T]> 可 以 用 RawVec: : 
into_box〈() 来 完成 ， 因 此 我 们 需要 一 个 RawVec 来 做 中 转 。 但 是 标准 库 
却 用 了 一 个 更 国 烦 的 实现 方式 ， 大 家 需要 注意 BoxBuilder 这 个 类 型 的 变 
量 是 干什么 的 。 


为 什么 明明 可 以 直接 在 一 个 方法 里 写 完 的 代码 ， 还 要 引入 一 个 新 的 
类 型 呢 ? 原 因 就 在 于 panic safety 问 题 。 注 意 我 们 这 里 调用 了 T 类 型 的 
clone 方 法 。I 是 一 个 泛 型 参数 ， 谁 能 保证 clone 方 法 不 会 产生 panic? 没有 














谁 能 保证 ， 我 们 只 能 尽 可 能 让 done 发 生 panic 的 时 候 ，RawVec 的 状态 不 


会 乱 掉 。 


所 以 ， 标 准 库 的 实现 利用 了 RAII 机 制 ， 即 便 在 clone 的 时 候 发 生 了 
panic， 这 个 BoxBuilder 类 型 的 局 部 变量 的 析 构 函数 依然 会 正确 执行 ， 并 
在 析 构 函数 中 做 好 清理 工作 。 上 面 这 段 代 码 之 所 以 搞 这 么 复杂 ， 就 是 为 
了 保证 在 发 生 panic 的 时 候 人 逻辑 依然 是 正确 的 。 


大 家 可 以 去 翻 一 下 标准 库 中 的 代码 ， 有 大 量 类 似 的 模式 存在 ， 都 是 
因为 需要 考虑 panic safety 问 题 。Rust 的 标准 库 在 编写 的 时 候 有 这 样 一 个 
目标 : 即便 发 生 了 panic， 也 不 会 产生 “内 存 不 安全 ”和 “线程 不 安全 ”的 情 
况 。 





在 Rust 中 ， 什 么 情况 下 panic 会 导致 bug 呢 ?这 种 情况 的 产生 需要 两 


-panic 导 致 了 数据 结构 内 部 的 状态 错误 ; 
这 个 错误 的 状态 会 在 以 后 被 观测 到 。 


在 unsafe 代 码 中 ， 这 种 情况 非常 容易 出 现 。 所 以 ， 在 写 unsafe 代 码 
的 时 候 ， 需 要 对 这 种 情况 非常 敏感 小 心 ， 一 不 小 心 就 可 能 因为 这 个 原因 
制造 出 “内 存 不 安全 ”。 


在 不 用 unsafe 的 情况 下 ，Panic Safety 是 基本 有 保障 的 。 考 虑 一 种 场 
景 、 假 如 我 们 有 两 个 数据 结构 ， 我 们 希望 每 次 在 更 新 其 中 一 个 的 时 候 ， 
也 要 对 另外 一 个 同步 更 新 ， 如 果 不 一 致 就 会 有 问题 。 万 一 更 新 了 其 中 一 
个 ， 发 生 了 panic， 第 二 个 没有 正常 更 新 怎么 办 ? 代码 示例 如 下 : 











use std::panic; 


fn main() { 

let mut x : Vec<i32> = vec![1]; 

let mut y : Vec<i32> = vec![2]; 

panic::catch_ unwind(|| { 
x.push(10); 
panic!("user panic"); 
y.push(100); 

}).ok(); 


println!("Observe corruptted data. {:?} {:2?2}", x, y); 


这 里 我 们 必须 使 用 catch_unwind 来 阻止 栈 展开 ， 人 否则 这 两 个 数据 结 
构 就 一 起 被 销毁 了 ， 无 法 观测 到 panic 引 发 的 错误 状态 。 编 译 可 见 ， 这 上 段 
代码 是 无 法 编译 通过 的 ， 错 误 如 下 : 








error[E0277]: the trait bound ‘&mut std::vec::Vec<i32>: std::panic::UnwindSafe ”IIS tr 





这 是 什么 原因 呢 ? 因为 catch_unwind 的 签名 是 这 样 的 : 





pub fn catch_unwind<F: Fnonce() -> R + UnwindSafe, R>(f: F) -> Result<R> 














它 要 求 闭 包 参 数 满 足 UnwindSafe 条 件 ， 而 标准 库 中 早 就 标记 好 了 
&mnut 型 指针 是 不 满足 UnwindSafe trait 的 。 有 些 类 型 ， 天 生 就 不 适合 在 
catch_unwind 的 外 部 和 内 部 同时 存在 。 


有 了 这 个 约束 条 件 ， 被 panic 破 坏 挥 的 数据 结构 被 外 部 继续 观测 、 使 
用 的 几率 就 小 了 许多 。 


当然 ， 编 译 占 是 永远 不 知道 用 户 的 真实 意图 的 ， 可 能 在 条 些 场 景 
下 ， 用 户 就 是 要 这 样 写 ， 而 且 不 认为 这 些 数 据 结构 是 “被 破坏 ”的 状态 。 
怎么 修复 上 面 这 个 编译 错误 昵 ?示例 如 下 : 











use std::panic; 
use std::panic::AssertUnwindSafe; 


fn main() { 

let mut x : Vec<i32> = vec![1]; 

let mut y : Vec<i32> = vec![2]; 

panic::catch unwind(AssertUnwindSafe(|| { 
x.push(10); 
panic!("user panic"); 
y.push(100); 

})).ok(); 


println!("Observe corruptted data. {:?} {:?2}", x, y); 





我 们 可 以 用 AssertUnwindSafe 把 这 个 闭 包 包 一 层 ， 就 可 以 强制 突破 
编译 器 的 限制 了 。 我 们 也 可 以 单独 为 某 个 变量 来 包 一 层 ， 可 以 起 到 一 样 
的 效果 。AssertUnwindSafe 这 个 类 型 ， 不 管内 部 包含 的 是 什么 数据 ， 它 
都 是 满足 catch_unwind 函 数 约束 的 。 这 个 设计 至 少 能 保证 catch_unwind 











可 能 造成 的 风险 是 显 式 标记 出 来 的 。 


同 理 ， 在 多 线程 情况 下 也 有 类 似 的 问题 。 比 如 ， 我 们 把 第 29 章 经 种 
用 的 示例 的 多 线程 修改 全 局 变量 的 程序 改 改 ， 在 其 中 茶 个 线程 中 制造 一 


个 panic: 











use std::sync::Arc; 
use std::sync::Mutex; 
use std::thread; 


const COUNT: U32 = 1000000 ; 


fn main() { 
let global = Arc::new(Mutex: :new(0)); 


let clone1 = global.clone(); 
let thread1 = thread::spawn(move|| { 
for _ in ©O..COUNT { 
match clone1.1lock(){ 
Ok(mut value) => *value +=1, 
Err(poisoned) => { 
let mut value = poisoned.into_ inner(); 
*value += 工 ; 


}); 


let clone2 = global.clone(); 
let thread2 = thread::spawn(move|| { 
for _ in ©O..COUNT { 
let mut value = clone2.1lock().unwrap(); 
*value -= 1; 
If *value < 100000 { 
println!("make a panic"); 
panic!("™"); 


}); 
thread1.join().ok(); 


thread2.join().ok(); 
println!("final value: {:?}", global); 





在 thread2 中 ， 在 达到 某 个 条 件 的 情况 下 会 发 生 panic。 这 个 panic 是 
在 Mutex 锁 定 的 状态 下 发 生 的 。 这 时 ， 标 准 库 会 将 Mutex 设 置 为 一 个 特 
殊 的 称 为 poisoned 状 态 。 处 在 这 个 状态 下 的 Mutex， 再 次 调用 lock， 会 返 
回 Err 状 态 。 它 里 面 依然 包含 了 原来 的 数据 ， 只 不 过 用 户 需要 显 式 调用 
into_inner 才 和 有 使 用 它 。 这 种 方式 防止 了 用 户 在 不 小 心 的 情况 下 产生 异常 
不 安全 的 风险 。 








18.4 “小结 


Rust 语 言 是 跟 C++ 非 常 相似 的 一 门 语言 。 它 们 的 定位 相似 ， 目 标 一 
致 ， 都 没有 GC， 都 面 癌 砌 层 硬 件 ， 都 希望 提供 比较 好 的 高 级 抽象 能 
力 ， 都 对 性 能 有 非常 高 的 有 要求。 而 这 也 意味 着 ， 在 许多 情况 下 ， 它 们 会 
肆 到 同样 的 问题 ， 有 着 类 似 的 设计 思路 。 


Rust 跟 C++ 最 大 的 区 别 在 于 ， 它 彻底 摆脱 了 C/ 人 /C++ 遗留 下 来 的 “前 辐 
兼容 性 ” 包 窟 ， 可 以 大 刀 益 和 借 地 引入 一 些 在 其 他 语言 中 早已 被 证 明了 的 
优秀 设计 。Rust 在 保持 底层 定位 的 同时 ， 把 关注 点 主要 放 在 了 “安全 
性 ”问题 上 。 除 了 前 面 介绍 的 “内 存 安全 ”、“ 线 程 安全 ”，Rust 在 “异常 安 
全 "方面 的 设计 也 非常 不 错 ， 只 是 比较 少 用 于 拿 出 来 宣传 而 已 ， 毕 竟 只 
有 C++ 是 跟 Rust 遭 遇 了 类 似 的 问题 ， 其 他 目 带 GC 的 语言 ， 在 这 个 问题 上 
基本 没什么 需要 特别 关注 的 。 在 这 个 问题 上 ，Rust 通 过 一 系列 设计 ， 将 
这 个 问题 基本 控制 在 了 unsafe 代 码 中 。 在 Safe 代码 部 分 ， 编 译 器 会 将 可 
能 发 生 异 常安 全 的 部 分 提示 出 来 ， 让 用 户 显 式 处 理 ， 用 户 基 本 不 会 由 于 
不 小 心 被 这 个 问题 “ 坑 ” 到 。 


里 然 Rust 抛 弃 了 “兼容 性 ”这 样 一 个 巨大 的 负担 ， 但 是 ， 这 并 不 意味 
者 设计 这 样 一 门 语言 是 件 轻 松 的 事情 。 在 “系统 级 ”编程 语言 这 个 “ 紧 畴 
死 ”之 下 ， 很 多 看 似 简 单 的 方面 都 需要 权衡 和 受 协 。 比 如 ,，“ 易 用 性 ”“ 简 
洁 性 ”总 是 永远 排 在 “安全 性 ”“ 性 能 ”这 样 的 目标 后 面 。 这 也 注定 了 Rust 的 
内 在 复杂 性 并 不 低 。 


最 后 要 强调 的 是 ，panic 并 不 意味 着 “内 存 不 安全 ”， 恰 恰 相 反 ， 它 是 
阻止 “内 存 不 安全 ”的 利器 。 和 内存 不 安全 造成 的 问题 比 程序 突然 退出 要 严 
重 得 多 。 在 即将 发 生 内 存 不 安全 现象 的 时 候 ， 如 果 当 时 已 经 没有 任何 其 
他 选择 ，panic 至 少 可 以 避免 最 坏 情况 的 发 生 。 然 后 我 们 可 以 很 快 发 现 事 
故 的 第 一 现场 ， 从 而 修复 代码 ， 使 其 继续 执行 。 











第 19 瘟 ”Unsafe 


到 目前 为 止 ，Rust 的 设计 让 人 觉得 非常 放心 。 利 用 类 型 系统 消除 空 
针 ， 简 洁 明 了 的 “唯一 修改 权 ” 原 则 ， 消 除了 野 指针 ， 还 有 各 种 智能 指 
针 可 以 使 用 ， 甚 至 可 以 利用 同样 的 规则 消除 多 线程 环境 下 的 数据 竞争 ， 
这 一 切 就 像 一 组 简洁 的 数学 定理 一 样 ， 构 建 了 一 整套 清晰 的 “内 存 安 
全 ”代码 的 “世界 观 ”。 

但 是 这 只 是 Rust 的 一 部 分 。 还 有 一 些 情 况 ， 纺 译 器 的 静态 检查 是 不 
够 用 的 ， 它 没 办 法 自动 推理 出 来 这 段 代码 究竟 是 不 是 安全 的 。 这 种 时 
候 ， 我 们 就 需要 使 用 unsafe 关 键 字 来 保证 代码 的 安全 性 。 


本 章 简 单 介绍 一 下 Rust 的 unsafe 代 码 。 





19.1 unsafe 关 键 字 


Rust 的 unsafe 关 键 字 有 以 下 几 种 用 法 : 

:用 于 修饰 函数 fn; 

.用 于 修饰 代码 块 ; 

:用 于 修饰 trait; 

:用 于 修饰 impl。 

当 一 个 名 是 unsafe 的 时 候 ， 意 味 着 我 们 在 调用 这 个 函数 的 时 候 需 要 
非常 小 心 。 它 可 能 要 求 调用 者 满足 一 些 其 他 的 重要 约束 ， 而 这 些 约束 条 
件 无 法 由 编译 器 自动 检查 来 保证 。 有 unsafe 修 饰 的 函数 ， 要 么 使 用 
unsafe 语 句 块 调用 ， 要 么 在 unsafe 函 数 中 调用 。 因 此 需要 注意 ，unsafe 函 
数 是 具有 “传递 性 ”的 ，unsafe 函 数 的 “调用 者 ”也 必须 用 unsafe 修 饰 。 


比如 ，String: : from_raw_parts 就 是 一 个 unsafe 函 数 ， 它 的 签名 如 
下 : 











pub unsafe fn from raw_parts(buf: *mut u8, length: usize, capacity: usize) -> Strinc 








它 之 所 以 是 unsafe 的 ， 是 因为 String 类 型 对 所 有 者 有 一 个 保证 : 它 内 
部 存储 的 是 合法 的 utf-8 字 符 串 。 而 这 个 函数 没有 检查 传递 进来 的 这 个 组 
冲 区 是 否 满 足 这 个 条 件 ， 所 以 使 用 者 必须 这 样 调用 : 











// 自己 保证 这 个 缓冲 区 包含 的 是 合法 的 utf-8 字符 串 
let s = unsafe { String::from raw parts(ptr as *mut _, len, capacity) } ，; 




















上 面 这 个 写法 就 是 unsafe 代 码 块 的 用 法 。 使 用 unsafe 关 键 字 包围 起 
来 的 语句 块 ， 里 面 可 以 做 一 些 一 般 情况 下 做 不 了 的 事情 。 但 是 ， 它 也 是 
有 规矩 的 。 与 普通 代码 比 起 来 ， 它 多 了 以 下 几 项 能 力 : 


.对 裸 指 针 执行 解 引用 操作 ; 











读 写 可 变 静 态 变 量 ; 
. 读 union 或 者 写 union 的 非 Copy 成 员 ; 
.调用 unsafe 函 数 。 


在 Rust 中 ， 有 些 地 方 必须 使 用 unsafe 才 能 实现 。 比 如 标准 库 提供 的 
一 系列 intrinsic 疯 数 ， 很 多 都 是 unsafe 的 ， 再 比如 调用 extern 函 数 必须 在 
unsafe 中 实现 。 另 外 ， 一 些 重要 的 数据 结构 内 部 也 使 用 了 unsafe 来 实现 
一 些 功 能 。 


当 unsafe 修 饰 一 个 trait 的 时 候 ， 那 么 意味 着 实现 这 个 trait 也 需要 使 用 
unsafe。 比 如 在 后 面 讲 线程 安全 的 时 候 会 着 重 讲解 的 Send、Sync 这 两 个 
trait。 因 为 它们 很 重要 ， 是 实现 线程 安全 的 根基 ， 如 果 由 程序 员 来 告诉 
编译 器 ， 强 制 指定 一 个 类 型 是 否 满足 Send、Sync， 那 么 程序 员 上 自己 必须 
很 谨慎 ， 必 须 很 清楚 地 理解 这 两 个 trait 代 表 的 含义 ， 编 译 器 是 没有 能 
推理 验证 这 个 impl 是 否 正 确 的 。 这 种 impl 对 程序 的 安全 性 影 啊 很 大 。 











19.2” 裸 指针 


Rust 提 供 了 两 种 裸 指针 供 我 们 使 用 ，*#const T 和 *mut 工 。 我 们 可 以 
通过 *mut 工 修 改 所 指 回 的 数据 ， 而 *const TI 不能。 在 unsafe 代 码 块 中 它们 
俩 可 以 互相 转换 。 

裸 指 针 相 对 于 其 他 的 指针 ， 如 Box，&，&mnut 来 说 ， 有 以 下 区 别 : 


-和 裸 指 针 可 以 为 空 ， 而 且 编译 喜 不 保证 裸 指针 一 定 指 癌 一 个 合法 的 
内 存 地 址 ; 


-不 会 执行 任何 自动 化 清理 工作 ， 比 如 自动 释放 内 存 等 ; 


. 裸 指针 赋值 操作 执行 的 是 简单 的 内 存 浅 复制 ， 并 且 不 存在 borrow 
checker 的 限制 。 


创建 裸 指针 是 完全 安全 的 行为 ， 只 有 对 裸 指针 执行 “ 解 引 用 ” 才 是 不 
安全 的 行为 ， 必 须 在 unsafe 语 句 块 中 完成 。 


示例 代码 如 下 : 








fn main() { 
let x = 1 i32,; 
let mut y : U32 = 1; 


let raw_mut = &mut y as *mut u32 as *mut i32 as *mut i64; // 这 是 安全 的 





unsafe 区 
*raw_mut = -1;  // 这 是 不 安全 的 , 必须 在 unsafe 块 中 才能 通过 编译 














println!("{:X} {:X}", xX, y); 


我 们 可 以 把 课 指 针 通 过 as 运 算 符 执行 类 型 转换 。 转 换 类 型 之 后 ， 它 
束 可 以 把 它 所 指向 的 数据 当成 男 外 一 个 类 型 来 操作 了。 原本 变量 y 的 类 
型 是 u32， 但 是 我 们 对 它 取 地 址 后 ， 最 后 将 指针 类 型 转换 成 了 i64。 此 
时 ， 我 们 对 该 指针 所 指 癌 的 地 址 进行 修改 会 发 生 “ 类 型 安全 ”问题 以 
及 “内 存 安 全 ”问题 。 编 译 ， 执 行 ， 这 段 代码 的 执行 结果 为 : 

















FFFFFFFF FFFFFFFF 











可 见 ，x 原 本 是 一 个 在 栈 上 存在 的 不 可 变 绑 定 ， 在 我 们 通过 裸 指针 
对 y 做 了 修改 之 后 ，x 的 值 也 发 生 了 变化 。 原 因 就 是 ， 我 们 对 指 问 y 的 指 
针 类 型 做 了 转换 ， 让 它 以 为 自己 指 癌 的 是 i64 类 型 ， 恰 巧 x 就 在 y 劳 边 ， 
城 门 失火 ， 珊 及 池 鱼 ，x 就 被 顺带 一 起 修改 了 。 从 这 个 示例 我 们 可 以 看 
到 ，unsafe 代 码 中 可 以 做 很 多 危险 的 事情 。 上 面 这 个 例子 就 是 一 个 错误 
的 unsafe 用 法 。 


再 比如 : 








fn raw_to_ref<'a>(p: *const i32) -> &'a i32 { 
unsafe { 
&*p 
} 
fn main() { 


let p : &i32 = raw_ to_ref(std::ptr::null::<i32>()); 
printin!("{}", p); 





编译 ， 执 行 ， 可 以 看 到 发 生 了 core dump。 为 什么 呢 ? 因为 unsafe 代 
码 写 错 了 。 这 段 代 码 里 面 直接 用 unsafe 功 能 把 一 个 裸 指 针 转 换 为 了 一 个 
共享 引用 ， 忽 略 了 Rnust 里 面 共享 引用 必须 遵循 的 规则 。 在 Rust 中 ，& 型 
引用 、&mnut 型 引用 以 及 Box 指 针 ， 全 部 要 求 是 合法 的 非 空 指针 。 在 
unsafe 代 码 中 ， 我 们 必须 上 自己 从 逻辑 上 保证 这 一 点 ， 和 否则 就 是 不 可 容忍 
的 严重 bug。 (注意 在 safe 代 码 中 是 没 办 法 构造 出 这 样 的 场景 的 。〉 有 些 
初学 者 可 能 会 在 写 FFI， 封 装 C 代 码 的 时 候 犯 这 样 的 错误 。 改 正方 法 如 
下 : 











fn raw_ to_ref<'a>(p: *const i32) -> Option<&'a i32> { 
If p.is_ null() { 
None 
} else 
unsafe { Some(&*p) } 


} 

fn main() { 
let p : Option<&i32> = raw_ to_ref(std::ptr::null::<i32>()); 
println!("{:?}", p); 

} 


天 


Rust 的 各 种 指针 还 有 一 些 重 要 约束 ， 比 如 &mut 型 指针 最 多 只 能 同时 
存在 一 个 。 这 些 约束 条 件 ， 在 unsafe 场 景 下 是 很 容易 被 打破 的 ， 而 编译 
器 并 没有 能 力 帮 我 们 自动 检查 出 来 。 我 们 之 所 以 需要 unsafe， 只 是 因为 
某 些 代 码 只 有 在 特定 条 件 下 才 是 安全 的 ， 而 这 个 条 件 我 们 没有 办 法 利用 
类 型 系统 表达 出 来 ， 所 以 这 时 候 需 要 依靠 我 们 目 己 来 保证 。 


大 家 干 万 不 要 到 处 滥用 unsafe。 当 你 不 得 不 使 用 unsafe 的 时 候 ， 请 
一 定 注 意 ， 这 并 不 意味 着 你 束 可 以 乱 写 不 安全 的 人 代码， 相反， 它 的 意思 
是 “编译 器 请 相信 我 ， 这 上 段 代 码 依然 是 安全 的 ， 它 的 安全 性 由 我 自己 负 
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裸 指 针 也 有 很 多 有 用 的 成 员 方 法 ， 读 者 可 以 参考 标准 文档 中 
的 “Primitive Type Pointer”。 比 如 ， 裸 指针 并 不 直接 文 持 算术 运算 ， 而 是 
提供 了 一 系列 成 员 方法 offset wrapping_offset 等 来 实现 指针 的 偏 移 运 算 。 


19.3 内置 函数 


在 标准 库 中 ， 有 一 个 std: : intrinsics 模 块 ， 它 里 面包 含 了 一 系列 的 
编译 器 内 置 函数 。 这 些 函 数 都 有 一 个 extern"rust-intrinsic" 修 饰 ， 它 们 看 
起 来 都 像 一 种 特殊 的 FFI 外 部 函数 ， 大 家 打开 标准 库 的 源 代 码 
SrC/core/intrinsics.rs， 可 以 看 到 这 些 函 数 根 本 没有 函数 体 ， 因 为 它们 的 实 
现 是 在 编译 嚣 内部， 而 不 是 在 标准 库 内 部 。 调 用 它们 的 时 候 都 必须 使 用 
unsafe 才 可 以 。 编 译 器 见 到 这 些 函 数 ， 就 知道 应 该 生成 什么 样 的 代码 ， 
而 不 是 像 普 通 函数 调用 一 样 处 理 。 另 外 ，intrinsics 是 藏 在 一 个 feature 
gate 后 面 的 ， 这 个 feature 可 能 永远 不 会 稳定 ， 这 些 函 数 就 不 是 准备 直接 
提供 给 用 户 使 用 的 。 一 般 标准 库 会 在 这 些 函 数 基础 上 做 一 个 更 合适 的 封 
装 给 用 户 使 用 。 


下 面 残 在 这 些 函 数 中 挑 一 部 分 作 介绍 。 











19.3.1 transmute 


fn transmute<T，U> (e: T) ->U 了 函数 可 以 执行 强制 类 型 转换 。 把 一 
个 T 类 型 参数 转换 为 U 类 型 返回 值 ， 转 换 过 程 中 ， 这 个 参数 的 内 部 二 进 
制 表 示 不 变 。 但 是 有 一 个 约束 条 件 ， 即 size_of: : <T> () 
==size_of: : <U> () 。 如 果 不 符 合 这 个 条 件 ， 会 发 生 编译 错误 。 
transmute_copy 的 作用 跟 它 类 似 ， 区 别 是 ， 参 数 类 型 是 一 个 借用 为 &T。 


一 般 情况 下 ， 我 们 也 可 以 用 as 做 类 型 转换 ， 把 &T 类 型 指针 转换 为 
裸 指针 ， 然 后 再 转换 为 &U 类 型 的 指针 。 这 样 也 可 以 实现 类 似 的 功能 。 
但 是 用 户 目 己 实 现 的 泛 型 函数 有 一 个 缺陷 ， 即 无 法 在 where 条 件 中 目 己 
表达 size of: : <T> () ==size of: : <U> () 。 而 transmute 作 为 一 个 
内 置 函 数 束 可 以 实现 这 样 的 约束 。 


transmute 和 transmute_copy 在 std: : mem 模 块 中 重新 导出 。 用 户 如 
果 需 要 ， 请 使 用 这 个 模块 ， 而 不 是 std: : intrinsics 模 块 。 


下 面 用 一 个 示例 演示 一 下 Vec 类 型 的 二 进 制 表示 是 怎样 的 : 











fn main() { 


let x = vec![1,2,3,4,5]; 


unsafe { 
let t : (usize, usize, usize) = std::mem::transmute_copy(&x); 
println!("{} 0 他" t.0, t.1, t.2); 
} 
} 





上 面 的 例子 中 ， 我 们 调用 了 transmute_copy， 因 此 参数 类 型 是 
&Vec。 假 如 我 们 用 transmute 孙 数 ， 参 数 类 型 就 必须 是 Vec， 区 别 在 于 ， 
参数 会 被 move 进 入 这 个 函数 中 ， 在 后 面 就 不 能 继续 使 用 了 。 在 调用 
transmnute_copy 函 数 的 时 候 ， 必 须 显 示 指 定 返 回 值 类 型 ， 因 为 它 是 泛 型 
函数 ， 返 回 值 类 型 可 以 有 多 种 多 样 的 无 穷 变化 ， 只 要 满足 size_of: : 
<T>() ==size_ of: : <U> 〈) 条 件 ， 都 可 以 完成 类 型 转换 。 所 以 编译 
器 自己 是 无 法 目 动 推理 出 返回 值 类 型 的 。 在 上 例 中 ， 我 们 的 返回 值 类 型 
是 包含 三 个 usize 的 tuple 类 型 。 这 是 因为 ，Vec 中 实际 包含 了 3 个 成 员 ， 一 
个 是 指 回 堆 上 的 指针 ， 一 个 是 指 癌 内 存 空间 的 总 大 小 ， 还 有 一 个 是 实际 
使 用 了 的 元 素 个 数 ， 因 此 这 个 类 型 转换 从 编译 器 看 来 是 满足 "占用 内 存 
空间 相同 ”这 一 条 件 的 。 


编译 执行 ， 我 们 就 可 以 看 到 Vec 内 部 的 具体 内 存 表示 了 。 执 行 结 











6393920 5 5 





19.3.2” 内存 读 写 


intrinsics 模 块 里 面 有 几 个 与 内 存 读 写 相 关 的 函数 ， 比 如 copy、 
copy_nonoverla-pping、write_bytes、move_val_init、volatile load 等 。 这 
些 也 | 数 又 在 std: : ptr/std: : mem 模 块 中 做 了 个 简 单 封装 , 然后 暴露 出 
来 给 用 户 使 用 。 下 面 挑 其 中 几 个 重要 的 函数 介绍 。 





1.copy 


ye 


copy 的 完整 签名 是 unsafe fn copy<T> (src: *const T，dst: *mut 
T，count: usize) 。 它 做 的 就 是 把 src 指 向 的 内 容 复 制 到 dst 中 去 。 它 跟 C 
语言 里 面 的 memmove 类 似 ， 都 假设 src 和 dst 指 向 的 内 容 可 能 有 重 毒 。 区 
别 是 memmove 的 参数 是 void* 类 型 ， 第 三 个 参数 是 字 节 长 度 ， 而 ptr: : 








copy 的 指针 是 市 类 型 的 ， 第 三 个 参数 是 对 象 的 个 数 。 


这 个 模块 中 还 提供 了 ptr: : copy_nonoverlapping。 它 跟 C 语 言 里 面 
的 memcpy 很 像 ， 都 假设 用 户 已 经 保证 了 src 和 dst 指 癌 的 内 容 不 可 重合 。 
所 以 ptr: : copy_nonoverlapping 的 执行 速度 比 ptr: : copy 要 快 一 些 。 


2.write 


在 ptr 模 块 中 ，write 的 签名 是 unsafe fn write<T> (dst: *mnut 工 ，Src: 
T，〉， 作 用 是 把 变量 src 写 入 到 dst 所 指 问 的 内 存 中 。 注 意 它 的 参数 src 是 使 
用 的 类 型 T， 执 行 的 是 move 语 义 。 查 看 源码 可 知 ， 它 是 基于 
intrinsics: : move_val_init 实 现 的 。 注 意 ， 在 写 的 过 程 中 ， 不 管 dst 指 回 
J 都 会 被 直接 窗 新 挥 。 而 src 这 个 对 象 也 不 会 执行 析 构 函 











写 内 存 还 有 ptr: : write_bytes、ptr: : write unaligned、ptr: : 
write_Vvol-artile 等 函数 。 


3.read 


在 ptr 模 块 中 ，read 的 签名 是 unsafe fn read<T> (src: *const 工 ) - 
>T， 作 用 是 把 src 指 向 的 内 容 当 成 类 型 T 返 回去 。 查 看 它 的 内 部 源码 ， 可 
见 它 就 是 基于 ptr: : copy_nonoverlapping 实 现 的 。 


读 内 存 还 有 ptr: : read_unaligned 以 及 ptr: : read_volatile 两 个 函 
数 ， 大 同 小 异 。 


以 上 这 些 内 存 读 写 函数 ， 都 是 不 管 语义 ， 直 接 操作 内 存 中 的 字 节 。 
所 以 它们 都 是 用 unsafe 函 数 。 


4.Swap 


在 ptr 模 块 中 ，swap 的 签名 是 unsafe fn swap<T> (x: *mut 工 ，y: 
*mut T) ， 作 用 是 把 两 个 指针 指向 的 内 容 做 交换 。 两 个 指针 所 指 同 的 对 
象 都 只 是 被 修改 ， 而 不 会 被 析 构 。 


这 个 函数 在 mem 模 块 中 又 做 了 一 次 封装 ， 变 成 了 unsafe fn 
swap<T> (x: &mutT，y: &mutT) 供用 户 使 用 。 签 名 中 的 &mut 型 引 
用 可 以 保证 这 两 个 指针 是 当前 唯一 指向 该 对 象 的 指针 。 


某 些 特殊 类 型 还 有 自己 的 swap 成 员 函 数 。 比 如 Cell: : 
swap 〈(&self，other: &Cell<T>) 。 这 个 函数 跟 其 他 swap 函 数 最 大 的 区 
别 在 于 ， 它 的 参数 只 要 求 共 享 引用 ， 不 要 求 可 变 引 用 。 这 是 因为 Cell 本 
号 的 特殊 性 。 它 有 具备 内 部 可 变性 ， 所 以 这 么 设计 是 完全 安全 的 。 我 们 可 
以 从 源码 看 到 ， 它 就 是 简单 地 调用 了 ptr: : swap。 





5.drop_in_place 


在 ptr 模 块 中 ，drop_in_place 的 签名 是 unsafe fn drop_in_place<T: ? 
Sized> (to_drop: *mutT) 。 它 的 作用 是 执行 当前 指 辣 对 象 的 析 构 函 
数 ， 如 果 没 有 就 不 执行 。 


6.uninitialized 


在 mem 模 块 中 ，uninitialized 的 签名 是 unsafe fn uninitialized<T> () - 
>T。 它 是 基于 intrinsics: : uninit 函 数 实现 的 。 我 们 知道 ，Rust 编 译 右 要 
求 每 个 变量 必须 在 初始 化 之 后 再 使 用 ， 如 果 在 某 些 情况 下 ， 你 确实 需要 
未 初始 化 的 变量 ， 那 么 必须 使 用 unsafe 才 能 做 到 。 注 意 ， 任 何 时 候 读 取 
未 初始 化 变量 都 是 未 定义 行为 ， 请 大 家 不 要 这 么 做 。 即 便 你 在 unsafe 代 
码 中 创造 了 未 初始 化 变量 ， 也 需要 自己 在 逻辑 上 保证 ， 读 取 这 个 变量 之 
前 先 为 它 合理 地 赋 过 值 。 


另外 ， 这 个 函数 有 点 像 std: : mem: : forget， 调 用 这 个 函数 ， 不 
仅 不 会 在 程序 中 增加 代码 ， 反 而 会 减少 可 执行 代码 。 调 用 forget， 会 导 
致 编译 器 不 再 插入 析 构 函数 调用 的 代码 ， 调 用 uninitialized 会 导致 缺少 初 
始 化 。 它 们 没有 任何 运行 开销 。 


uninitialized 函 数 也 还 没有 稳定 ， 它 有 一 些 无 法 元 服 的 缺陷 ， 将 来 标 
准 库 会 废弃 挥 这 个 函数 ， 而 使 用 一 个 新 的 类 型 让 用 户 在 unsafe 代 码 中 创 
建 未 初始 化 变量 。 








19.3.3 ”综合 示例 


下 面 我 们 用 一 个 示例 来 演示 一 下 这 些 unsafe 函 数 的 用 途 ， 以 及 怎样 
才能 正确 调用 unsafe 代 码 。 示 例 很 简单 ， 就 是 实现 标准 库 中 的 内 存 交 换 
函数 std: : mem: : swap。 





我 们 可 以 确定 这 个 函数 的 签名 是 fn swap<T> (x: &mutT，Yy: 
&mut T) 。 关 于 泛 型 的 解释 在 第 21 章 中 有 ， 此 处 略 过 不 提 。 先 试 一 个 最 
简单 的 实现 : 











fn swap<T>(x: &mut T, y: &mut T) { 
Jekt Zz: T= *xX’? 
“x = *y; 
“y= 72; 

} 





编译 不 通过 。 因 为 let z=*x; 执行 的 是 move 语 义 ， 编 译 占 不 允许 我 
们 把 x 指向 的 内 容 move 出 来 ， 这 只 是 一 个 借用 而 已 。 如 果 人 允许 执行 这 样 
的 操作 ， 会 村 致 原来 的 借用 指针 x 指向 非法 数据 。 但 是 我 们 知道 ， 我 们 
这 个 函数 整体 上 是 可 以 保证 安全 的 ， 因 为 我 们 把 x 指向 的 内 容 move 出 来 
之 后 ， 会 用 其 他 的 正确 数据 填 回 去 ， 最 终 可 以 保证 函数 执行 完 之 后 ，x 
De DO ee oT A ee 




















fn swap<T>(x: &mut T, y: &mut T) { 
unsafe 区 
let mut t: T = mem::uninitialized(); 


ptr::copy_nonoverlapping(&*x, &mut t, 1); 
ptr::copy_nonoverlapping(&*y, x, 1); 
ptr::copy_nonoverlapping(&t, y, 1); 


mem: :forget(t); 





代码 逻辑 的 意思 如 下 。 


首先 ， 我 们 依然 需要 一 个 作为 中 转 的 局 部 变量 。 这 个 局 部 变量 该 怎 
么 初始 化 呢 ? 其 实 我 们 不 希望 它 执行 初始 化 ， 因 为 我 们 只 需要 这 部 分 内 
存 空 间 而 已 ， 它 里 面 的 内 容 马 上 就 会 被 窗 新 挥 ， 做 初始 化 是 浪费 性 能 。 
况且 ， 我 们 也 不 知道 用 什么 通用 的 办 法 初始 化 一 个 泛 型 类 型 ， 它 连 
Default 约 束 都 未 必 满 足 。 所 以 我 们 要 用 mem: : uninitialized 函 数 。 

接 下 来 ， 我 们 可 以 直接 通过 内 存 复 制 来 交换 两 个 变量 。 因 为 在 Rust 


中 ， 所 有 的 类 型 、 所 有 的 move 操 作 ， 都 是 简单 的 内 存 复制 ， 不 涉及 其 
他 的 语义 。Rust 语 言 已 经 假定 任何 一 个 类 型 的 实例 ， 随 时 都 可 以 被 move 





到 另外 的 地 方 ， 不 会 产生 任何 问题 。 所 以 ， 我 们 可 以 直接 使 用 ptr: : 
copy 系 列 函 数 来 完成 。 再 加 上 在 safe 代 码 中 ，&mnut 型 指针 具有 排他 性 ， 
我 们 可 以 确信 ，Xx 和 y 一 定 指 回 不 同 的 变量 。 所 以 可 以 使 用 ptr: : 
coOpy_nonoverlapping 函 数 ， 比 ptr: : copy 要 快 一 点 。 


最 后 ， 一 定 要 记得 ， 要 阻止 临时 的 局 部 变量 t 执 行 析 构 函数 。 因 为 t 
本 里 并 未 被 合理 地 初始 化 ， 它 内 部 的 值 是 直接 通过 内 存 复 制 获得 的 。 在 
复制 完成 后 ， 它 内 部 的 指针 如果 有 的 话 ) 会 和 y 指 癌 的 变量 是 相同 
的 。 如 果 我 们 不 阻止 它 ， 那 么 在 函数 结束 的 时 候 它 的 析 构 函数 就 会 被 目 
动 调用 ， 这 样 y 指 向 的 变量 残 变 成 非法 的 了 。 


这 样 我 们 才能 正确 地 完成 这 个 功能 。 虽 然 源 代码 看 起 来 比较 长 ， 但 
古 实际 生成 的 代码 并 不 多 ， 残 是 3 次 内 存 块 的 复制 。 假 设 执行 的 时 候 泛 
型 参数 T 被 实例 化 为 Vec<i32>， 这 个 swap 函 数 的 执行 流程 如 图 19-1 所 
外。 














在 新 版 本 的 标准 库 的 源码 中 ， 做 法 比 这 个 更 复杂 ， 主 要 是 为 了 更 好 
地 优化 执行 效率 。 它 并 没有 在 内 存 中 分 配 一 个 临时 对 象 ， 而 是 尽 可 能 利 
用 寄存 器 做 数据 交换 。 具 体 细节 惑 不 展开 了 ， 大 家 可 以 自己 去 读 源码 ， 
目 己 答 试 做 性 能 测试 。 









图 19-1 










图 19-1 ( 续 ) 


19.4 ”分割 借用 


“alias+mnutation” 规 则 非常 有 用 。 然 而 ，alias 分 析 在 倍 到 复合 数据 次 
型 的 时 候 也 会 非常 无 条 。 我 们 看 看 下 面 的 示例 : 





Struct Foo { 
a: i32, 
b: i32, 
Ci 132, 
} 


fn main() { 
let mut x = Foo {a: 0，b: 0, c: 0}; 


let pa = &mut x.a; 
let pb = &mut x.b; 
let pc = &x.c; 

*pb += 工 ; 

let | = 2 (op 
xDa 十 二 


RE "ff {} {}", pa, pb, pe, pc2); 





这 种 何况 ， Rust 编 译 器 可 以 愉快 地 通过 编译 ， 因 为 它 知道 ， 指 针 
pa、pb、pc 分 别 指 同 的 是 不 同 的 内 存 区 域 ， 它 们 之 间 不 是 aliass 关 系 ， 所 
以 这 些 指针 完全 可 以 共存 。 但 是 ， 我 们 把 数据 类 型 从 结构 体 转 为 数组 之 
后 ， 情况 就 变 了 : 





fn main() { 
let mut x = [1 i32, 2, 3]; 


let pa = &mut x[0]; 
let pb = &mut x[1]; 
let pc = &x[2]; 

“pb += 1; 

let se = ee 
xDa 十 三 


na "ff {} {}", pa, pb, pe, pce2); 





这 段 代码 所 做 的 事情 其 实 跟 上 面 一 段 代 码 基 本 一 样 。 编 译 ， 发 生 错 
误 ， 错 误 信 息 为 : 





error: cannot borrow ‘x[..] as mutable more than once at a time 





这 时 候 ，Rust 编 译 器 判定 Ba、pb、pc 存 在 alias 关 系 。 它 没 办 法 搞 清 
楚 &x[A]、 &x[B]、&x[C] 之 间 是 否 有 可 能 有 重 辣 。 为 什么 编译 器 没 办 法 
搞 清楚 它们 之 间 是 否 有 重 闭 呢 ? 


首 匈 ， 要 考 碟 到 实际 程序 中 作为 索引 的 变量 很 可 能 不 是 编译 期 闻 
量 ， 而 是 根据 运行 期 的 值 决 定 ，A、B、C 可 以 是 任意 表达 式 。 


其 次 ， 索 引 操作 运算 符 其 实 是 在 标准 库 中 实现 的 ， 除 了 数组 ， 还 有 
许多 类 型 也 能 文 持 索引 操作 ， 比 如 HashMap。 即 便 编 译 器 知道 了 A、 
B、C 三 个 索引 没有 重 登 ， 它 也 无 法 直接 推理 出 &x[A]、&x[B]、&x[C] 
之 间 是 舍 有 重合 。 两 个 不 同 字符 串 做 索引 实际 上 指向 了 同一 个 值 也 有 可 


全 已 
月 上。 
































所 以 ， 对 于 结构 体 类 型 ， 编 译 器 可 以 很 轻松 地 知道 ， 指 向 不 同 成 员 
的 指针 一 定 不 重 登 ， 而 对 于 数组 切片 ， 编 译 器 的 推理 结果 是 将 x[_ ] 视 为 
一 个 整体 ，&x[A]、&x[B]、&x[C] 之 间 都 算 重 登 。 虽 然 读 者 可 以 看 出 
来 ，&mnut x[0..2] 和 &mut x[3..4] 根 本 就 是 指 问 两 块 独立 的 内 存 区 域 ， 它 
们 同时 存在 是 完全 安全 的 。 但 是 编译 器 却 觉得 ，&mut x[A] 和 &mut x[B] 
一 定 不 能 同时 存在 ， 人 否则 就 违反 了 alias+mutation 的 设计 原则 。 


那么 面 对 这 样 的 情况 ，Rust 该 如何 解决 呢 ? 如果 说 我 们 可 以 确定 两 
块 数组 切片 确实 不 存在 重 登 ， 我 们 应 该 怎么 告诉 编译 器 呢 ? 


这 就 需要 用 到 标准 库 中 的 split_at 以 及 split_at_mut 方 法 。 首 先 ， 我 们 
看 看 它 的 使 用 方式 : 

















fn main() { 

let mut x = [1 i32, 2, 3]; 

{ 
let (first, rest) : (&mut [i32], &mut [i32]) = x.split at_mut(1); 
let (second, third): (&mut [i32], &mut [i32]) = rest.split at_mut(1); 
first[0] += 2; 
second[0] += 4; 
third[0] += 8; 
println!("{:?2} {:?2} {:?}", first, second, third); 


} 
println!("{:?}", &x); 





执行 结果 为 : 





[3] [6] [11] 
[3, 6, 11] 





使 用 split_at_mut 方 法 ， 可 以 将 一 个 Slice 切 分 为 两 个 部 分 返回 ， 返 回 
值 中 包括 的 两 个 值 分 别 都 是 指向 原 Slice 的 &mut[T] 型 切片 。 这 样 可 以 保 
证 这 两 个 数组 切片 一 定 不 会 发 生 重 辣 ， 因 此 它们 可 以 同时 存在 两 个 
&mut 型 指针 ， 同 时 修改 原来 的 数组 ， 而 不 会 制造 内 存 不 安全 。 


那么 split_at_mut 方 法 内 部 实现 是 怎么 做 的 呢 ? 它 的 源码 如 下 所 示 : 





#[inline] 

fn split at mut(&mut self, mid: usize) -> (&mut [T], &mut [T]) { 
let len = self.1len(); 
let ptr = self.as mut_ptr(); 


unsafe 区 
assert!(mid <= len); 


(from raw_ parts mut(ptr, mid) 
from raw_parts mut(ptr.offset(mid as isize), len - mid)) 
} 
} 





整体 的 逻辑 并 不 复杂 ， 只 是 需要 一 点 unsafe 代 码 来 辅助 。 这 说 明 ， 
Rust 的 这 套 alias+tmutation 规 则 ， 虽 然 威力 巨大 ， 但 也 误伤 了 一 些 “ 好 
人 ”。 存 在 一 些 情况 是 ， 实 际 上 内 存 安 全 但 是 无 法 被 编译 器 接受 。 面 对 
这 样 的 情况 ， 我 们 可 以 利用 Rust 的 unsafe 代 码 ，case by case 地 解决 问 


匮 。 


另外 需要 强调 的 是 ，unsafe 一 定 不 能 滥用。 应 该 尽量 把 unsafe 代 码 
封装 在 一 个 较 小 的 范围 ， 对 外 公开 的 是 完全 safe 的 API。 如 果 不 懂得 如 
何 抽象 ， 把 unsafe 散 沙 在 业务 逻辑 的 各 个 角 沙 中 ， 那 么 这 就 相当 于 退化 
成 了 C 语 言 ， 甚 至 更 糟糕 。 


还 需要 特别 强调 的 一 点 是 ， 用 户 更 加 不 要 做 自欺欺人 的 事情 ， 把 一 
个 明明 是 unsafe 的 函数 声明 成 普通 函数 ， 仅 仅 为 了 调用 的 时 候 稍微 方便 
一 点 。 请 大 家 一 定 要 注意 : 如 果 一 个 函数 有 可 能 在 某 些 场景 下 制造 出 内 
存 不 安全 ， 那 么 它 必 须 用 unsafe 标 记 ， 不 能 偷懒 。 哪 怕 这 个 可 能 性 微 乎 
其 微 也 不 行 。 在 调用 unsafe 函 数 的 地 方 ， 调 用 者 必须 反复 确认 被 调用 的 
这 个 unsafe 函 数 的 前 置 条 件 和 后 置 条 件 是 否 满足 ， 不 能 简单 地 用 unsafe 
代码 块 框 起 来 。 




















19.5 ” 协 变 


19.5.1 什么 是 协 变 


Rnust 的 生命 周期 参数 是 一 种 泛 型 类 型 参数 。 比 如 ， 我 们 可 以 这 样 理 
解 共享 引用 : 





type StrRef<'a> = &'a str; 





这 是 一 个 指向 字符 串 的 借用 指针 。 它 是 一 个 泛 型 类 型 ， 接 受 一 个 汽 


型 参数 ， 之 后 形成 一 个 完整 类 型 。 它 跟 Vec<T> 很 像 ， 只 不 过 Rust 里 面 泛 
型 类 型 参数 既 有 生命 周期 ， 又 有 普通 类 型 。 下 面 是 一 个 示例 : 





type StrRef<'a> = &'a str; 


fn print_str<'b>(s: StrRef<'b>) { 
println!("{}", s); 


fn main() { 
Jet s : StrRef<'static> = "hello"; 
print_str(s); 


} 





这 个 例子 中 演示 了 一 种 有 意思 的 现象 。 大 家 看 一 下 ，print_str 接 受 
的 参数 类 型 是 Str-Ref<'b>， 而 实际 上 传 进来 的 参数 类 型 是 
StrRef<'static>， 这 两 个 类 型 并 不 完全 一 致 ， 因 为 b! ='static。 但 是 Rust 
可 以 接受 。 这 种 现象 在 类 型 系统 中 被 称 为 “ 协 变 ”(covariance ) 和 “ 逆 


变 ”(contravariance) 。 


协 变 和 道 变 的 定义 如 下 。 我 们 用 <: 符号 记录 子 类 型 关系 ， 对 于 泛 


型 类 型 C<T>， 
: 协 变 


若 T1<: T2 时 满足 C<T1><: C<T2>， 则 C 对 于 参数 T 是 协 变 关系 。 





若 T1<: T2 时 满足 C<T2><: C<T1>， 则 C 对 于 参数 T 是 逆 变 关系 。 

:不 变 

上 述 两 种 都 不 成 立 。 

总 结 起 来 束 是 ， 如 果 类 型 构造 器 保持 了 参数 的 子 类 型 关系 ， 束 是 协 
变 ; 如 果 逆 转 了 参数 的 子 类 型 关系 ， 束 是 道 变 。 其 他 情况 ， 就 是 不 变 。 

Rust 不 文 持 普通 泛 型 参数 类 型 的 协 变 和 逆 变 ， 只 对 生命 周期 泛 型 参 
数 存 在 协 变 和 逆 变 。 


在 Rust 中 ， 泛 型 类 型 文 持 针对 生命 周期 的 协 变 是 一 个 重要 功能 。 大 
家 试想 一 下 ， 下 面 这 条 语句 为 什么 能 成 立 : 











let s : &str = "hello",; 








"hello" 是 一 个 字符 串 字 面 量 ， 它 的 类 型 是 &'static str。 而 s 是 一 个 局 

部 变量 ， 它 的 类 型 是 &'s str。 其 中 泛 型 参数 在 源码 中 省 略 挤 了 ， 这 个 生 
命 周期 泛 型 参数 代表 的 是 这 个 局 部 变量 从 声明 到 结束 的 这 段 区 域 。 在 这 
人 句 话 中 ， 我 们 把 一 个 生命 周期 更 长 的 引用 &'static sr， 赋 值 给 了 一 个 生 

命 周 期 更 短 的 引用 &'a str， 这 是 没 问 题 的。 原因 在 于 ， 既 然 这 边 被 指 癌 
的 目标 在 更 长 生命 周期 内 都 是 合法 的 ， 那 么 它 在 一 个 较 短 生命 周期 内 也 
一 定 是 合法 的 。 所 以 ， 我 们 可 以 说 引用 类 型 & 对 生命 周期 参数 具有 协 变 
关系 。 (此 处 有 些 争论 ， 有 人 认为 这 里 应 该 理解 为 逆 变 关系 ， 主 要 的 争 
议 来 自 于 我 们 很 难说 清 两 个 生命 周期 ， 究 竟 准 是 准 的 子 类 型 。 本 书 中 为 
了 行文 的 方便 ， 继 续 使 用 * 协 变 ”， 但 主要 意思 是 “ 协 变 or 逆 变 ”， 是 跟 * 不 
变 ” 的 概念 相对 并 的 。) 


接 下 来 ， 我 们 可 以 通过 一 些 示例 继续 理解 其 他 一 些 泛 型 类 型 的 协 变 
关系 。 示 例如 下 : 























fn test<'a>(s : &'a &'static str) { 
Jet local : &'a &'a str = s; 
} 


从 这 个 示例 我 们 可 以 看 到 ，&'a &'static str 类 型 可 以 安全 地 赋值 给 
&'a &'a str 类 型 。 由 于 &'static str<: &'a str 以 及 &a &'static str<: &'a &'a 
str 关 系 成 立 ， 这 说 明 引 用 类 型 针对 泛 型 参数 T 也 是 具备 协 变 关系 的 。 


把 上 面 的 示例 改 一 下 ， 试 试 &'a mut TT 型 指针 : 











fn test<'a>(s : &'a mut &'static str) { 
Jet local : &'a mut &'a str = s,; 
} 








编译 ， 可 见 出 现 了 生命 周期 错误 。 这 说 明 从 &'a mut &'static str 类 型 
到 &a mut &'a str 类 型 的 转换 是 不 安全 的 。 此 事 可 以 说 明 ，&mnut 型 指针 
针对 泛 型 TT 参数 是 不 变 的 。 


下 面 再 试 试 Box 类 型 : 








fn test<'a>(s : Box<&'static str>) { 
let local : Box<&'a str> = s; 
} 





这 上段 代码 可 以 编译 通过 ， 说 明 从 Box<&'static str> 类 型 到 Box<&'a 
str> 类 型 的 转换 是 安全 的 。 所 以 Box<T> 类 型 针对 T 参 数 是 具备 协 变 关系 
的 。 


下 面 再 试 试 函 数 fn 类 型 。 注 意 血 类 型 有 两 个 地 方 可 以 使 用 泛 型 参 
数 ， 一 个 是 参数 那里 ， 一 个 是 返回 值 那里 。 我 们 写 两 个 测试 用 例 : 





fn test_arg<'a>(f : fn(&'a str)) { 
let local : fn(&'static str) = f; 
} 


fn test_ret<'a>(f : fn()->&'a str) { 
let local : fn()->&'static str = f; 
} 





test_arg 可 以 通过 编译 ，test_ret 不 能 通过 。 意 思 是 ，fn(&'a str) 类 


型 可 以 转换 为 (&z'static str) 类 型， 而 fn 〈) ->&x'a str 类 型 不 能 转换 为 
fn 〈) ->&rstatic str 类 型 。 这 意味 着 类 型 f(T) ->U 对 于 泛 型 参数 TIT 具 备 
协 变 关系 ， 对 于 U 不 具备 协 变 关系 。 如 果 我 们 把 这 个 测试 改 一 下 ， 尝 试 





把 生命 周期 参数 换个 位 置 : 





fn test_ret<'a>(f : fn()->&'a str) { 
f(); 
} 


fn main() { 
fn s() -> &'static str { return "",; } 


test_ret(s); 





上 面 这 段 代 码 可 以 编译 通过 。 这 意味 着 fn() ->&z'static str 类 型 可 以 
安全 地 转换 为 和 〈) ->&'a str 类 型 。 那 我 们 可 以 说 ， 类 型 mm (T) ->U 对 
于 参数 U 具 备 乾 变 关 系 。 


再 换 成 具备 内 部 可 变性 的 类 型 试验 : 





use std::cell::Cell; 


fn test<'a>(s : Cell<&'static str>) { 
let local : Cell<&'a str> = s; 
} 





编译 出 现 了 生命 周期 不 匹配 的 错误 。 这 说 明 Cell<T> 类 型 针对 T 参 数 
不 具备 协 变 关系 。 全 于 为 什么 要 这 样 设计 ， 前 面 已 经 讲 过 了 ， 如 果 有 具备 
内 部 可 变性 的 类 型 还 有 生命 周期 协 变 关 系 ， 可 以 构造 出 基 空 指针 的 情 
况 。 所 以 需要 编译 器 提供 的 UnsafeCell 来 表达 针对 类 型 参数 具备 “不 
变 ” 天 系 的 泛 型 类 型 。 


同样 ， 我 们 可 以 试 试 襟 指 针 : 





fn test<'a>(s : *mut &'static Str) { 
Jet local : *mut &'a str = s; 
} 





可 以 得 出 结论 ，*const T 针 对 T 参 数 具 备 协 变 关系 ， 而 *mut T 针 对 
参数 是 不 变 关 系 。 比 如 标准 库 里 面 的 Box<T>。 它 的 内 部 包含 了 一 个 裸 
指针 ， 这 个 裸 指针 就 是 用 的 *const T 而 不 是 *+mut T。 这 是 因为 我 们 希望 
Box<T> 针 对 T 参 数 具 备 协 变 关系 ， 而 *mut T 无 法 提供 。 





在 写 unsafe 代 码 的 时 候 ， 特别 是 涉及 泛 型 的 时 候 ， 往 往 需 要 我 们 手 
动 告 诉 编译 器 ， 这 个 类 型 的 泛 型 参数 究竟 应 该 是 什么 协 变 关 系 。 很 多 情 
况 下 ， 我 们 需要 使 用 PhantomData 类 型 来 表达 这 个 信息 。 


19.5.2 PhantomData 


在 写 unsafe 代 码 的 时 候 ， 我 们 经 常会 碰 到 一 种 情况 ， 那 就 是 一 个 类 
型 是 之 有 生命 周期 参数 的 ， 它 表达 的 是 一 种 借用 关系 。 可 是 它 内 部 是 用 
裸 指针 实现 的 。 请 注意 ， 裸 指针 是 不 市 生命 周期 参数 的 。 于 是 就 发 生 了 
下 面 这 样 的 情况 : 





struct Iter<'a, T: 'a>{ 
ptr: *const T, 
end: *const TT, 


} 





然而 ， 在 Rust 中 ， 如 果 一 个 类 型 的 泛 型 参数 从 来 没有 被 使 用 过 ， 那 
么 就 是 一 个 编译 错误 。 请 参考 RFC 0738-variance。 如 果 一 个 泛 型 参数 从 
来 没有 使 用 过 ， 那 么 编译 器 就 不 知道 这 个 泛 型 参数 对 于 这 个 类 型 是 否 有 具 
备 协 变 逆 变 关系 ， 那 么 束 可 能 在 生命 周期 分 析 的 时 候 做 出 错误 的 结论 。 
所 以 编译 器 禁止 未 使 用 的 泛 型 参数 。 在 这 种 情况 下 ， 我 们 可 以 使 用 
PhantomData 类 型 来 告诉 编译 器 协 变 逆 变 方 面 的 信息 。 


PhantomData 没 有 运行 期 开销 ， 它 只 在 类 型 系统 层面 有 意义 。 比 
如 ， 一 个 目 定 义 类 型 有 一 个 泛 型 参数 'a 没 有 被 使 用 ， 为 了 表达 这 个 类 型 
对 于 泛 型 参数 'a 具 备 协 变 关 系 ， 那 我 们 可 以 为 它 加 一 个 成 员 ， 并 且 把 类 
型 制定 为 PhantomData<'aT> 即 可 。 因 为 前 面 我 们 已 经 说 了 &'a 工 类 型 对 于 
泛 型 参数 'a 具 备 协 变 关 系 ， 所 以 编译 堪 就 可 以 推理 出 来 这 个 上 自 定 义 类 型 
对 于 泛 型 参数 'a 具 备 协 变 关 系 。 其 他 用 法 与 此 类 似 ， 你 要 表达 一 个 什么 
样 的 协 变 道 变 关系 ， 就 找 一 个 现存 的 类 似 的 类 型 ， 拿 它 当 作 
PhantomData 的 泛 型 参数 即 可 。 




















PhantomData 定 义 在 std: : marker 模 块 中 : 





#[lang = "phantom data"] 
#[stable(feature = "rust1", since = "1.0.0")] 
pub struct PhantomData<T:?Sized>,; 





蕊 是 一 个 0 六 小 的 、 特殊 的 泛 型 类 型 。 尼 二 面 有 #lang-…] 属 性 标 
记 ， 这 说 明和 它 是 编译 如 特 殊 照顾 的 类 型 。 它 主要 是 用 于 写 unsafe 代 码 
时 ， 告 诉 编 译 器 这 个 类 型 的 语义 信息 。 


如 果 你 想 表 达 这 个 类 型 对 T 类 型 成 员 有 拥有 关系 ， 那 么 可 以 使 用 
PhantomData<T>。 例 如 std: : core: : ptr: : Unique: 








pub struct Unique<T: ?Sized> { 
pointer: NonZero<*const T>， 
_marker: PhantomData<T>, 


} 








如 果 你 想 表 达 这 个 类 型 对 T 类 型 成 员 有 借用 关系 ， 那 么 可 以 使 用 


PhantomData<&'a IT>。 


你 还 可 以 用 它 来 表明 当前 这 个 类 型 不 可 Send、Sync， 示 例如 下 : 





struct MyStruct { 
data: String, 
_marker: PhantomData<*mut ()>, 


} 





下 面 同样 用 比较 完整 的 示例 来 演示 一 下 这 个 类 型 的 具体 作用 。 假 设 
我 们 现在 有 两 个 类 型 : 





use std::fmt::Debug; 


#[derive(Clone, Debug)] 
struct Ss; 


#[derive(Debug)] 
struct R<T: Debug> { 
x: *const T 


} 





其 中 R 类 型 想 表 达 一 种 借用 关系 ， 它 内 部 需要 用 裸 指针 实现 。 上 面 
这 种 简单 的 写法 是 有 问题 的 ， 因为 我 们 可 以 很 容易 制造 出 悬空 指针 4 





fn main() { 
let mut r= R{ x: std::ptr::null() }; 


let local = S{}; 


r.x = &local; 


// r.x now is dangling pointer 


} 





为 了 让 编译 器 使 用 borrow checker 检 查 这 种 内 存 错 误 ， 我 们 可 以 给 R 
类 型 添加 一 个 生命 周期 参数 ， 并 且 利 用 PhantomData 使 用 这 个 生命 周期 
参数 ， 避 人 免 “ 未 使 用 泛 型 参数 ”的 错误 。 同 时 给 R 类 型 增加 一 个 成 员 方 
法 ， 在 成 员 方 法 中 改变 指针 的 地 址 ， 并 且 通 过 模块 系统 禁止 外 部 用 户 直 
接 访问 R 的 内 部 成 员 。 完 整 代 码 如 下 所 示 : 











use std::fmt::Debug; 
use std::ptr::null; 
use std::marker::PhantomData; 


#[derive(Clone, Debug)] 
struct Ss; 


#[derive(Debug)] 

struct R<'a, T: Debug + 'a> { 
x: *const T， 
marker: PhantomData<&'a T>, 


impl<'a, T: Debug> Drop for R<'a, T> { 
fn drop(&mut self) { 
unsafe { println!("Dropping R while S {:?}", *self.x) } 
} 


} 


impl<'a, T: Debug + 'a> R<'a, T> { 
pub fn ref_to<'b: 'a>(&mut self, obj: &'b T) { 
self.x = obj; 
} 


fn main() { 
let mut r = R { x: null(), marker: PhantomData }; 


let local = Sf{}; 
r.ref_to(&local); 





再 编 详 ， 我 们 可 以 看 到 ， 这 次 编 诺 器 就 可 以 成 功 发 现 生 命 周 期 错 
误 ， 禁 止 悬 挂 指针 的 产生 。 在 写 FFI 给 C 代 码 做 封装 的 时 候 ， 需 要 经 常 使 
用 裸 指 针 ， 这 时 就 可 以 用 类 似 的 技巧 来 处 理 生 命 周 期 的 问题 。 


19.6 ”未 定义 行为 

在 C/C++ 等 语言 中 ， 未 定义 行为 undefined behavior， 人 简称 UB ) 指 
的 是 ， 在 某 些 情况 下 语言 标准 允许 编译 器 做 任何 事情 ， 无 论 发 生 什么 后 
果 都 是 正常 的 ， 不 属于 编译 器 的 bug。 比 如 ， 对 空 指针 做 “ 解 引 用 ” 操 
作 ， 在 C/C++ 里 面 就 是 未 定义 行为 ， 编 译 占 可 以 决定 做 任何 事情 。 

在 C/C++ 标准 里 面 ， 很 多 情况 下 ， 都 有 充分 的 理由 将 某 些 行为 定义 
为 UB， 这 是 语言 本 身 的 定位 决定 的 。 它 可 以 简化 编译 器 的 设计 ， 也 可 
以 最 大 化 执行 效率 ， 还 可 以 最 大 化 路 平台 ， 等 等 。 但 是 我 们 也 应 该 承 
认 ， 过 多 的 UB 是 对 用 户 极 其 不 友好 的 。 在 Rust 里 面 ，UB 被 限制 在 了 一 
个 较 小 的 范围 内 ， 只 有 unsafe 代 码 有 可 能 制造 出 UB， 这 也 是 在 写 unsafe 
代码 的 时 候 需 要 注意 的 。 

下 面 列举 一 些 undefined behavior， 摘 抄 自 Rust 的 Reference 文 档 : 

.数据 竞争 

. 解 引 用 空 指针 或 者 巧 空 指针 


-使 用 未 对 齐 的 指针 读 写 内 存 而 不 是 使 用 read_unaligned 或 者 


write_unaligned 
读 取 未 初始 化 内 存 
破坏 了 指针 别名 规则 
通过 共享 引用 修改 变量 (除非 数据 是 被 UnsafeCell 包 于 的 ) 
-调用 编译 器 内 置 函数 制造 UB 
给 内 置 类 型 赋予 非法 值 
给 引用 或 者 Box 赋 值 为 空 或 者 惹 空 指 针 
给 bool 类 型 赋值 为 0 和 1 之 外 的 数字 




















:给 enum 类 型 赋予 类 型 定义 之 外 的 tag 标 记 
给 char 类 型 赋予 超过 char: : MAX 的 值 
全 str 类 型 赋予 非 utf-8 编 码 的 值 


| 完整 列表 请 大 家 参考 由 方 文 档 。 这 些 问 
题 只 可 能 在 写 unsafe 代 码 的 时 候 出 现 ， 这 都 是 需要 读者 注意 的 地 方 。 
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Rust 的 unsafe 关 键 字 是 一 个 难点 ， 也 是 很 多 初学 者 困惑 的 地 方 。 很 
多 人 有 这 样 的 疑惑 : 既然 Rust 允 许 使 用 unsafe 来 完成 许多 危险 的 操作 ， 
那么 Rust 的 安全 性 保证 是 不 是 就 没什么 意义 了 ? 


这 件 事情 不 能 这 么 理解 。unsafe 的 存在 不 是 来 故意 破坏 安全 性 的 ， 

它 只 是 一 种 面向 更 底层 操作 的 接口 。 不 同 的 高 级 语言 对 于 什么 是 底层 的 
定义 是 不 同 的， 但 是 所 有 的 高 级 语言 ， 只 要 不 断 往 底 层 探 帘 ， 总 会 储 到 
safe 与 unsafe 之 间 的 分 界线 。 比 如 ，Java 有 自己 的 JNI 机 制 ，C# 也 有 
unsafe 关 键 字 ，Python 也 可 以 调用 C 模 块 ， 甚 至 C/C++ 语 言 都 可 以 内 般 汇 
编 。 当 你 在 高 级 语言 中 与 底层 操作 交互 的 时 候 ， 必 须 确保 高 级 语言 中 的 
一 些 规 则 和 约定 。Java、C# 这 类 语言 ， 利 用 GC 实 现 了 内 存 安 全 ， 但 是 
用 户 同样 可 以 使 用 JNI/unsafe 实 现 不 安全 的 操作 ， 但 这 件 事 情 并 不 意味 
着 Java、C# 语 言 本 身 有 安全 性 缺陷。 同 理 ， 在 C 语 言 里 面 用 内 藤 汇 编 搞 
乱 了 堆栈 ， 也 不 能 说 是 C 语 言 的 设计 缺陷。 只 不 过 是 用 户 使 用 这 些 机 制 
的 时 候 ， 没 有 一 个 自动 检查 工具 来 保证 安全 性 ， 而 是 必须 由 自己 来 保证 
上 层 代 码 和 下 层 代 码 之 则 交互 的 正确 性 。 


Rust 的 unsafe 最 大 的 问题 在 于 ， 到 目前 为 止 ， 依 然 没 有 一 份 官方 文 
档 来 明确 哪些 东西 是 用 户 可 以 依赖 的 、 哪 些 是 编译 右 实 现 相 关 的 、 哪 些 
是 以 后 永远 不 变 的 、 哪 些 是 将 来 可 能 会 有 变化 的 。 所 以 ， 哪 怕 用 户 能 确 
保 目 己 写 出 来 的 unsafe 代 码 在 目前 版 本 上 是 完全 正确 的 ， 也 没 办 法 确保 
不 会 在 以 后 的 版 本 中 出 问题 。 如 果 以 后 编译 器 的 实现 发 生 了 变化 ， 导 致 
了 unsafe 代 码 无 法 正常 工作 ， 究 竟 算 是 编译 器 的 bug 还 是 用 户 错 误 地 依赖 
了 某 些 特性 ， 还 说 不 清楚 。 正 式 的 unsafe guideline 还 在 继续 编写 过 程 
中 。《 当 然 这 种 错误 情况 几率 是 很 低 的 ， 绝 大 多 数 用 户 使 用 unsafe 的 时 
候 都 是 在 FFI 场 景 下 ， 不 会 涉及 那些 精微 细密 的 语义 规则 。) 


我 们 既 不 能 过 于 小 用 unsafe， 也 不 该 对 它 心怀 恐惧 。 它 只 是 表明 ， 
菏 些 代码 的 安全 性 依赖 于 茶 些 条 件 ， 而 我 们 无 法 清晰 地 在 代码 中 表达 这 
些 约束 条 件 ， 因 此 无 法 由 编译 器 帮 我 们 自动 检查 。 


unsafe 是 Rust 的 一 块 重要 拼图 ， 充 分 理解 unsafe 的 意义 和 作用 ， 才 能 
让 我 们 更 好 地 理解 safe 的 来 源 和 可 贵 。 






































不 尽 知 用 兵 之 害 者 ， 则 不 能 尽 知 用 兵 之 利 也 。 孙子 兵法 





第 20 童 ”Vec 源 码 分 析 


本 节 将 通过 一 个 比较 完整 的 例子 ， 把 内 存 安全 问题 分 析 一 表 。 本 闻 
选择 的 例子 是 标准 库 中 的 基本 数据 结构 Vec<T> 源 代码 分 析 。 之 所 以 选 
择 这 个 模块 作为 示例 ， 其 一 是 因为 这 个 类 型 作为 非常 基础 的 数据 结构 ， 
平时 用 得 很 多 ， 大 家 都 很 熟悉 ， 第 二 个 原因 是 ， 恰 好 它 的 内 部 实现 又 完 
全 展现 了 Rust 内 存 安 全 的 方方面面 ， 深 入 剖析 它 的 内 部 实现 非常 有 利于 
加 深 我 们 对 Rust 内 存 安全 的 认识 。 本 半 中 用 于 分 析 的 代码 是 1.23 nightly 
版 本 ，Vec 的 内 部 实现 源码 在 此 之 前 一 直 有 所 变化 ， 以 后 也 很 可 能 还 会 
有 变化 ， 请 读者 注意 这 一 点 。 


我 们 先 从 使 用 者 的 角度 分 析 一 下 Vec 是 如 何 自 动 管 理 内 存 空间 的 : 

















fn main() { 
Jet mut vi = Vec::<i32>: :new(); 
println!("Start: length {} capacity {}", vi.len(), vi.capacity()); 


for i in 1..10 { 

vi.push(i); 

println!("[Pushed {}] length {} capacity {}", i, vi.len(), vi.capacity()); 
} 


let mut v2 = Vec::<i32>::with capacity(1); 
println!("Start: length {} capacity {}", v2.len(), v2.capacity()); 


v2.reserve(10); 
for i in 1..10 { 
v2.push(i); 
println!("[Pushed {}] length {} capacity {}", i, v2.len(), v2.capacity()); 
} 
} 





编译 ， 执 行 ， 从 结果 中 可 以 看 出 ， 如 果 用 new 方 法 构造 出 来 ， 一 开 
始 的 时 候 是 没有 分 配 内 存 空间 的 ，capacity 为 0。 我 们 也 可 以 使 用 
with_capacity 来 构造 新 的 Vec， 可 以 自行 指定 预 留 空间 大 小 ， 还 可 以 对 
己 有 的 Vec 调 用 reserve 方 法 扩展 预 留 空间 。 在 同 容 器 内 部 插入 数据 的 时 
候 ， 如 果 当 前 容量 不 够 用 了 ， 它 会 自动 申请 更 多 的 空间 。 当 变量 生命 周 
期 结束 的 时 候 ， 它 会 自动 释放 它 管理 的 内 存 空间 。 





20.1 内 存 申 请 


首先 ， 我 们 知道 Vec 是 一 个 动态 数组 ， 它 会 根据 情况 动态 扩展 当前 
的 空间 大 小 。 在 Rust 以 及 C++ 这 样 的 语言 中 ， 动 态 数组 这 样 的 类 型 是 由 
库 来 实现 的 ， 而 不 是 像 菜 些 带 GC 的 语言 一 样 由 运行 时 环境 内 置 提供 。 
这 征 因为 Rust 和 C++ 一 样 ， 痢 具备 对 内 存 的 直接 控制 力 ， 其 中 一 个 表现 
就 是 ， 可 以 手动 调用 内 存 分 配器 ， 目 己 管理 内 存 分 配 和 释放 的 策略 。 动 
态 数 组 类 型 的 基本 思想 是 : 它 不 像 内 置 数 组 一 样 直接 把 数据 保存 到 栈 
上 ， 而 是 在 堆 上 开辟 一 块 空间 来 保存 数据 ， 在 癌 Vec 中 插入 数据 的 时 
候 ， 如 果 当 前 已 分 配 的 空间 不 够 用 了 ， 它 会 重新 分 配 更 大 的 内 存 空间 ， 
把 原 有 的 数据 复制 过 去 ， 然 后 继续 执行 插入 操作 。 


在 目前 版 本 的 标准 库 中 ，Vec 类 型 的 源码 存在 于 liballoc/vec.rs 文 件 
中 。 它 的 定义 很 简单 : 














pub struct Vec<T> { 
buf: RawVec<T>, 
len: usize, 


} 





它 只 有 两 个 成 员 : 一 个 是 RawVec<T> 类 型 ， 管 理 内 存 空 间 的 分 配 和 
释放 ; 另外 一 个 是 usize 类 型 ， 记 录 当 前 包含 的 元 素 个 数 。Vec 的 new 和 
capacity 方 法 都 很 简单 : 





pub fn new() -> Vec<T> { 
Vec { 
buf: RawVec: :new(), 
len: 0, 
} 


pub fn with_capacity(capacity: usize) -> Vec<T> { 
Vec { 
buf: RawVec: :with_capacity(capacity), 
len: 0, 
} 
} 





我 们 继续 深入 查看 RawVec 这 个 类 型 的 new 和 capacity 方 法 是 如 何 实 
现 的 。 它 的 源码 在 liballocraw_vec:rs 文 件 中 : 


一 


pub struct RawVec<T, A: Alloc = Heap> { 
ptr: Unique<T>, 
cap: usize, 
a: A, 

} 


impl<T> RawVec<T, Heap> { 
pub fn new() -> Self { 
Self::new_in(Heap) 


} 
pub fn with_capacity(cap: usize) -> Self { 
RawVec: :allocate_in(cap, false, Heap) 
} 
} 





从 这 里 可 以 看 到 ，RawVec 的 泛 型 参数 比 Vec 多 了 一 个 ， 这 个 泛 型 参 
数 代 表 的 是 内 存 分 配器 allocator。 这 个 设计 的 目的 是 让 Rust 的 标准 容器 
能 像 C++ 中 的 一 样 ， 可 以 由 用 尸 上 自行 指定 内 存 分 配器 。 这 个 功能 目前 还 
处 于 设计 过 程 中 ， 因 此 只 有 RawVec 中 有 这 个 功能 ， 而 Vec 还 没有 ， 以 后 
Vec 同 样 也 会 有 这 样 一 个 泛 型 参数 的 。 这 个 泛 型 参数 有 一 个 默认 值 ， 叫 
作 Heap， 是 标准 库 给 我 们 提供 的 默认 内 存 分 配器 。 一 般 来 说 ， 内 存 分 配 
峰 都 是 0 大 小 的 类 型 ， 它 没有 任何 成 员 ， 不 保存 任何 状态 信息 。 比 如 
Heap 这 个 类 型 的 定义 : 








#[derive(Copy, Clone, Default, Debug)] 
pub struct Heap; 





继续 分 析 RawVecHRnew 方 法 。 它 调用 了 它 自己 的 new_in 方 法 ， 并 将 
allocator 作 为 参数 传递 进去 。 因 为 Heap 类 型 没有 成 员 ， 所 以 它 可 以 直接 
用 它 的 名 字 当 作 一 个 对 象 实 例 来 使 用 。 这 个 new_in 方 法 是 这 样 实现 的 : 








pub fn new_in(a: A) -> Self { 
// !0 is usize::MAX. This branch should be stripped at compile time. 
let cap = if mem::size of::<T>() == 0 { !0 } else {0}; 


// Unique::empty() doubles as "unallocated" and "zero-sized allocation" 


RawVec { 
ptr: Unique: :empty(), 
cap, 
av 

} 


} 





对 于 成 员 ptr 以 及 成 员 a， 痢 是 简单 的 默认 构造 。 只 有 成 员 cap 的 处 理 


稍微 麻烦 一 点 。 主 要 是 考虑 到 0 大 小 类 型 的 问题 ， 如 果 类 型 参数 T 的 大 小 
是 0， 那 么 显然 Vec 即 便 不 申请 任何 内 存 ， 也 可 以 存 下 任意 多 的 T 类 型 成 
员 。 因 为 不 管 你 往 Vec 中 插入 多 少数 据 ， 总 大 小 依然 是 9。 所 以 这 里 的 处 
理 逻 辑 就 是 ， 当 size_of: : <T> () ==0 的 时 候 ，cap 的 取 值 是 usize: : 
MAX。 这 里 的 ! 0 的 写法 ， 实 际 上 是 对 0 按 位 取 反 。 











再 回 看 RawVec 的 with_capacity 方 法 。 它 调用 了 它 自 己 的 allocate_in 
方法 。 这 个 方法 的 实现 如 下 所 示 : 





fn allocate_ in(cap: usize, zeroed: bool, mut a: A) -> Self { 
unsafe { 
let elem size = mem::size_ of::<T>(); 


let alloc_ size = cap.checked mul(elem size).expect("capacity overflow"); 
alloc_guard(alloc_size); 


// handles ZSTs and ‘cap = 0” alike 
let ptr = if alloc size == 0 { 
mem: :align_of::<T>() as *mut u8 
} else { 
let align = mem::align_of::<T>(); 
let result = if zeroed { 
a.alloc zeroed(Layout::from size align(alloc_ size, align).unwrap()) 
} else { 
a.alloc(Layout::from size align(alloc_size, align).unwrap()) 


/ 
match result { 
Ok(ptr) => ptr, 
Err(err) => a.oom(err), 


}; 

RawVec { 
ptr: Unique: :new_unchecked(ptr as *mut _), 
cap, 
ay 

} 


} 
} 





首先 计算 需要 分 配 的 内 存 大 小 。 它 使 用 了 checked_mul 处 理 淤 出 问 
题 。 然 后 考虑 0 大 小 的 问题 。 此 时 无 须 调用 内 存 分 配 吉 的 方法 ， 而 是 直 
接 返 回 一 个 数值 很 小 的 指针 “(一般 情 况 下 这 个 值 就 是 1) 。 为 了 有 利于 
编译 器 后 端 优化 ， 这 个 指针 保证 了 与 T 类 型 字 节 对 齐 。 此 时 不 是 直接 用 
数值 0， 主 要 是 为 了 和 “ 空 指针 ”做 区 分 。 因 为 RawVec 已 经 假定 了 它 的 成 
员 ptr 永 远 不 会 是 空 指针 ， 所 以 它 用 了 Unique 类 型 。 这 种 设计 可 以 让 
Option<Vec<T>> 拥 有 和 Vec<T> 相 同 的 大 小 ， 而 无 须 浪费 空间 。 


最 后 我 们 再 来 分 析 一 下 RawVec 里 面 的 ptr 成 员 。 它 是 Unique<T> 这 
个 类 型 。 这 个 类 型 的 定义 如 下 : 





pub struct Unique<T: ?Sized> { 
pointer: NonZero<*const T>， 
_marker: PhantomData<T>, 


} 








这 个 类 型 是 在 裸 指 针 基 础 上 做 了 一 点 封闭。 


` 它 通过 PhantomData<T> 方 式 ， 辣 编译 器 表达 了 “ 它 是 T 类 型 对 象 的 
拥有 者 ”这 样 一 个 概念 。PhantomData 这 个 类 型 是 一 个 0 大 小 的 、 被 编译 
器 特殊 对 待 的 类 型 ， 它 有 一 个 attribute 做 修饰 #[lang="phantom_data"]， 
几 是 被 #[lang=...] 修 饰 的 东西 ， 都 是 被 编译 器 特殊 处 理 的 ， 跟 普通 用 户 
自己 定义 的 不 一 样 。 


:因为 从 逻辑 上 说 这 个 指针 不 应 该 为 空 ， 因 此 它 使 用 NonZero 做 了 一 
个 包装 。NonZero 这 个 类 型 也 是 一 个 特殊 类 型 ， 它 也 有 一 个 attribute 是 # 
[lang="non_zero"]。 在 编译 器 内 部 ， 会 认为 这 个 类 型 的 取 值 永远 不 可 能 
为 0。 这 样 在 某 些 情况 下 ， 编 译 器 可 以 根据 这 个 信息 优化 存储 空间 。 比 
如 Option<Box<T>> 占 据 的 空间 大 小 跟 Box<T> 整 一模一样 ， 无 须 额外 空 
间 ， 这 里 的 关键 就 是 Box<T> 内 部 也 使 用 了 NonZero 这 个 类 型 。 














.Unique<T> 还 实现 了 Send 和 Sync 这 两 个 trait。unsafe impl<T: 
Send+? Sized>Send for Unique<T>{}unsafe impl<T: Sync+? Sized>Sync 
for Unique<T>{} 


标准 库 中 很 多 底层 的 数据 结构 都 需要 基于 裸 指 针 ， 使 用 unsafe 代 人 码 
才能 实现 。 而 很 多 数据 结构 都 需要 表达 一 种 “对 成 员 拥有 有 所有权 ”这 样 一 
个 概念 ， 因 此 它们 有 一 些 共 同 的 代码 可 以 复 用 。 这 就 是 为 什么 RawVec 
是 基于 Unique 类 型 而 不 是 直接 基于 裸 指针 来 实现 的 原因 。 因 为 抽象 出 的 
这 样 一 个 Unique 类 型 ， 不 止 在 实现 动态 数组 的 时 候 有 用 ， 还 可 以 在 实现 
Box<T>HashMap<K，V> 等 类 型 的 时 候 有 用 。 











20.2 内存 扩容 


接 下 来 我 们 分 析 一 下 Vec: : push 这 个 方法 是 如 何 实现 的 。 源 码 如 
下 : 





pub fn push(&mut self, value: T) { 
If self.len == self.buf.cap() { 
self.buf.double( ); 


unsafe { 
let end = self.as mut_ptr().offset(self.len as isize); 
ptr::write(end, value); 
self.len += 1; 
} 
} 





首先 判断 当前 是 否 还 有 空余 容量 ， 如 末 不 够 ,就 调用 RawVec 的 
double 方 法 ， 如 果 足 够 ， 直 接 走 下 面 的 逻辑 。 接 下 来 就 是 把 数据 插入 
Vec 的 做 法 。 这 里 直接 使 用 了 ptr: : write 方法 ， 它 做 的 事情 其 实 就 是 简 
单 地 把 数据 按 位 复制 到 目标 位 置 。 请 注意 ， 在 Rust 中 这 么 做 是 完全 正确 
的 ， 因 为 它 没 有 “复制 构造 冰 数 “移动 构造 冰 数 “复制 运算 符 重 载 "之 类 
的 东西 ， 如 果 我 们 要 把 一 个 对 象 move 到 另外 一 个 地 方 ， 那 就 只 需要 把 
这 个 对 象 按 位 复制 到 目的 地 址 即 可 。 当 然 我 们 还 要 防止 对 象 在 原来 那个 
地 方 调用 析 构 函数 ， 恰 好 ptr: : write 方法 可 以 满足 这 个 要 求 。 








接 下 来 继续 看 一 下 RawVec: : double 方 法 是 怎么 实现 的 : 





pub fn double(&mut self) { 
unsafe { 
let elem size = mem::size_ of::<T>(); 


let (new cap, uniq) = match self.current_layout() { 
Some(cur) => { 
let new cap = 2 * self.cap; 
let new_size = new_cap * elem size; 
let new layout = Layout::from size align_ unchecked(new size, cur. alic 
alloc_guard(new_ size); 
let ptr_res = self.a.realloc(self.ptr.as_ptr() as *mut u8, 
cur, 
new_layout); 
match ptr_res { 
Ok(ptr) => (new_cap, Unique: :new_ unchecked(ptr as *mut T)), 
Err(e) => self.a.oom(e), 
} 
} 


None => { 
let new cap = if elem size > (!0) /8{1} else {4}; 
match self.a.alloc array::<T>(new cap) { 
Ok(ptr) => (new_cap, ptr), 
Err(e) => self.a.oom(e), 


} 
} 
}; 
self.ptr = uniq; 
self.cap = new_cap; 





其 中 RawVec: : current_layout 方 法 的 实现 如 下 : 





fn current_layout(&self) -> Option<Layout> { 
If self.cap == © { 
None 
} else { 
unsafe { 
let align = mem::align_of::<T>(); 
let Size = mem::size of::<T>() * self.cap; 
Some(Layout::from size align unchecked(size, align)) 





由 此 可 见 ， 如 果 当 前 capacity 是 0， 即 一 开始 用 Vec: : new() 方法 
初始 化 的 情况 下 ， 新 的 容量 一 般 设 置 为 4， 除 非 这 个 元 素 特 别 大 。 对 于 
当前 capacity 不 是 0 的 情况 ， 会 调用 allocator 的 realloc 方 法 ， 申 请 一 个 两 倍 
于 当前 大 小 的 空间 。 





20.3 内存 释放 
20.3.1 Vec 的 析 构 函数 





在 Rust 中 ，RATII 手 法 是 非常 常用 的 资源 管理 方式 。Vec 就 是 利用 
RAII 来 进行 资源 管理 的 。 因 此 ， 接 下 来 我 们 需要 分 析 Vec 的 析 构 函数 : 





unsafe impl<#[may_dangle] T> Drop for Vec<T> { 
fn drop(&mut self) { 
unsafe { 
// use drop for [T] 
ptr::drop_in_place(&mut self[..]); 


// RawVec handles deallocation 


} 
} 





目前 版 本 的 Vec， 在 impl Drop trait 的 时 候 使 用 了 unsafe 关 键 字 ， 而 
且 使 用 了 #[may_dangle] 这 个 attribute。 它 是 跟 drop check 相 关 的 ， 下 一 节 
会 继续 分 析 。 现 在 继续 看 这 个 析 构 函数 的 逻辑 ， 它 调用 了 libcore 里 面 的 
ptr: : drop_in_place 函 数 : 





#[lang = "drop_in_place"] 

#[allow(unconditional recursion)] 

pub unsafe fn drop_in place<T: ?Sized>(to drop: *mut T) { 
// Code here does not matter - this is replaced by the 
// real drop glue by the compiler. 
drop_in_place(to_drop); 

} 





而 这 个 函数 有 #[lang="drop_in_place"]attribute， 这 说 明 它 是 编译 器 
提供 的 特殊 实现 ， 所 以 它 的 函数 体 我 们 就 不 再 继续 深究 了 ， 这 里 写 的 不 
是 它 的 真实 逻辑 。 总 之 它 就 是 告诉 编译 器 ， 调 用 这 个 指针 指向 对 象 的 析 
构 函 数 。 需 要 注意 的 是 约束 T: ? Sized， 这 意味 着 这 个 泛 型 参数 可 以 是 
定 长 类 型 ， 也 可 以 是 变 长 类 型 ， 即 DST。 当 T 古 变 长 类 型 的 时 候 ， 这 个 
指针 *mut IT 实际 上 是 一 个 “ 胖 指 针 ”， 这 种 情况 它 也 是 可 以 处 理 的 。 


所 以 我 们 看 到 在 Vec 的 析 构 函数 里 面 ， 传 递 进去 的 实际 参数 是 一 个 
数组 切片 slice。 编 译 器 会 逐个 调用 这 个 slice 里 面 每 个 对 象 的 析 构 函数 。 





Vec 的 析 构 函数 调用 完 之 后 ， 编 译 器 还 会 目 动 调用 它 所 有 成 员 的 析 
构 函 数 。 我 们 再 看 一 下 RawvVec 类 型 的 析 构 函数 : 





unsafe impl<#[may_dangle] T, A: Alloc> Drop for RawVec<T, A> { 
/// Frees the memory owned by the RawVec *without* trying to Drop its contents. 
fn drop(&mut self) { 
unsafe { self.dealloc buffer(); } 
} 
} 





它 做 的 事情 就 是 回收 内 存 ， 无 须 调用 析 构 函数 。 其 中 dealloc_buffer 
函数 的 实现 为 : 





impl<T, A: Alloc> RawVec<T, A> { 
/// Frees the memory owned by the RawVec *without* trying to Drop its contents. 
pub unsafe fn dealloc buffer(&mut self) { 
let elem size = mem::size of::<T>(); 
If elem size != 0 { 

If let Some(layout) = self.current_ layout() { 
let ptr = self.ptr() as *mut u8; 
self.a.dealloc(ptr, layout); 

} 

} 
} 
} 








当 size_of: : <T> () 是 0 的 时 候 ， 根 本 没有 在 堆 上 分 配 内 存 ， 所 以 
无 须 处 理 ;， 和 否则 ， 调 用 allocator 的 dealloc 函 数 即 可 。 


20.3.2 Drop Check 


下 面 来 详细 说 明 一 下 什么 是 drop check。Vec 的 析 构 函数 中 出 现 的 # 
[may_dangle] 究 竟 是 什么 呢 ? 


请 大 家 注意 ，'a: 了 这 个 标记 代表 的 含义 是 'a 比 b 长 或 者 相等 。 什 么 
情况 下 ， 它 们 可 以 相等 呢 ? 当 两 个 变量 声明 在 同一 条 语句 的 时 候 ， 它 们 
的 生命 周期 是 相等 的 。 


也 就 是 说 ， 假 如 我 们 按 顺 序 声明 两 个 变量 : 











let a 
let b 


default( ); 
default( ); 


Hl 


那么 a 的 生命 周期 一 定 严 格 大 于 b 的 生命 周期 。 如 果 我 们 记录 a 的 生 
命 周 期 为 a，b 的 生命 周期 为 b， 那 么 a: Pb 成 立 ， 而 b: "a 不成立。 因 
此 ， 在 a 里 面 引 用 b 一 定 是 行 不 通 的 。 


但 是 ， 假 如 我 们 把 它们 在 一 条 语句 中 一 起 声明 : 


let (a, b) = (default(), default()); 


它们 的 生命 周期 是 相等 的 。 如 果 我 们 记录 a 的 生命 周期 为 a，b 的 生 
命 周期 为 b， 那 么 'a: b 成 立 ， 而 b: 'a 也 成 立 。 我 们 可 以 用 示例 来 证 
明 : 


fn main() { 


let (a, mut b) : (i32, Option<&i32>) = (1, None); 
b = Some(&a); 


let (mut a, b) : (Option<&i32>, i32) = (None, 1); 
a = Some(&b); 


上 面 的 代码 可 以 编译 通过 ， 正 是 说 明了 以 上 的 状况 。 


Rust 之 所 以 这 么 规定 ， 是 因为 在 同一 条 语句 中 声明 出 来 的 不 同 变量 
绑 定 ， 无 法 根据 先后 关系 确定 出 哪个 严格 包含 于 哪个 。tuple 里 面 的 两 个 
成 员 的 生命 周期 不 存在 严格 大 于 和 小 于 关系 ，struct 里 面 不 同 成 员 的 生 

命 周 期 也 不 存在 严格 大 于 和 小 于 关系 ， 数 组 里 面 不 同 成 员 的 生命 周期 同 
样 不 存在 严格 大 于 和 小 于 关系 。 它们 的 生命 周期 都 是 相等 的 。 


这 就 引出 了 一 个 问题 。 两 个 不 同 的 变量 在 析 构 的 时 候 ， 总 会 出 现 一 
个 先 一 个 后 ， 不 可 能 同时 析 构 。 如 果 同 一 条 语句 中 声明 的 不 同 变量 可 以 
存在 引用 关系 ， 那 么 如 果 我 们 在 析 构 函数 中 ， 试 图 访问 另外 一 个 变量 ， 
会 出 现 什么 情况 呢 ? 我 们 写 一 个 示例 : 




















struct T { dropped: bool } 


impl T { 


fn new() -> Self { 
T { dropped: false } 
} 


} 


impl Drop for T { 
fn drop(&mut self) { 
self,.dropped = true; 
} 


} 


struct R<'a> { 
inner: Option<&'a T> 


impl<'a> R<'a> 
fn new() -> Self { 
R { inner: None } 


} 

fn set_ref<'b :'a>(&mut self, ptr: &'b T) { 
self.inner = Some(ptr); 

} 


} 


impl<'a> Drop for R<'a> { 
fn drop(&mut self) { 
If let Some(ref inner) = Self,inner { 
println!("droppen R when T is {}", inner.dropped); 


} 
} 


fn main() { 


let (a, mut b) : (T, R) = (T::new(), R::new()); 
b.set_ref(&a); 


rc 


let (mut a, b) : (R, T) = (R::new(), T::new()); 
a.set_ref(&b); 





这 个 示例 保持 了 上 个 示例 的 代码 结构 ， 只 是 把 基本 类 型 符 换 成 了 于 
有 析 构 函数 的 目 定 义 类 型 。 编 译 之 后 出 现 了 生命 周期 编译 错误 : 





error[E0597]: ‘a does not live long enough 





这 样 看 来 ， 我 们 原来 想象 的 ， 在 析 构 函数 中 访问 相同 生命 周期 的 变 
量 ， 制 造 内 存 不 安全 的 想法 是 行 不 通 的 。 


为 什么 前 面 的 代码 使 用 基本 i32 和 &i32 类 型 可 以 编译 通过 ， 而 我 们 





换 成 自 定义 类 型 束 通 不 过 了 呢 ? 这 就 是 所 谓 的 drop checker。Rust 在 涉及 
析 构 函数 的 时 候 有 个 特殊 规定 ， 即 如 果 两 个 变量 具有 析 构 函数 ， 且 有 互 
相 引 用 的 关系 ， 那 么 它们 的 生命 周期 必须 满足 “严格 大 于 ”的 关系 。 这 个 
关系 目前 在 源码 中 表达 不 出 来 ， 但 是 为 了 防止 析 构 函数 中 出 现 内 存 安全 
问题 ， 编 译 器 内 部 对 此 专门 做 了 检查 。 


但 是 这 种 检查 又 有 点 过 于 严格 。 因 为 在 很 多 情况 下 ， 虽 然 它 们 有 引 
用 关系 ， 但 是 并 没有 在 析 构 函数 中 做 数据 访问 。 此 事 取 决 于 析 构 函数 具 
体 做 了 什么 。 如 有 果 析 构 函 数 没有 做 什么 危险 的 事情 ， 那 么 它们 之 间 的 生 
命 周 期 满足 普通 的 大 于 等 于 关系 就 够 了 。 所 以 设计 者 决定 ， 和 暂时 留 一 个 
后 门 ， 让 用 户 告诉 编译 器 这 个 析 构 函数 究竟 危险 还 是 不 危险 ， 这 就 是 # 
函数 
改 为 : 











unsafe impl<#[may_dangle] 'a> Drop for R<'a> { 
fn drop(&mut self) { 
} 

} 


再 打开 相应 的 feature gate: 





#![feature(generic param attrs, dropck_eyepatch)] 


以 上 代码 就 可 以 编译 通过 ， 生 命 周 期 冲突 问题 就 消失 了 。 这 就 是 为 
什么 Vec<T> 的 析 构 函数 用 | 的 原因 。 加 了 这 个 attribute 可 
以 让 Vec 类 型 容纳 生命 周期 不 满足 “严格 大 于 ”关系 的 元 素 。 


关于 此 事 的 详细 解释 ， 请 参考 RFC-1327-dropck-param-eyepatch。 这 
个 功能 也 只 是 临时 措施 ， 关 于 drop check 的 部 分 ， 后 面 还 会 有 改进 。 


20.4 不 安全 的 边界 


Vec 有 一 个 成 员 方 法 叫 作 set_len， 可 以 用 于 改变 动态 数组 的 大 小 。 
它 的 源码 如 下 : 





pub unsafe fn set_len(&mut self, len: usize) { 
self.len = len; 








关于 这 个 方法 ， 需 要 请 大 家 注意 的 是 ， 它 有 unsafe 标 记 。 它 的 内 部 
只 是 一 个 usize 类 型 的 赋值 而 已 ， 怎 么 会 是 unsafe 呢 ? 


因为 ， 我 们 的 Vec 内 部 实现 非 第 依赖 于 self.len 这 个 值 的 合法 性 。 如 
果 说 这 个 方法 不 是 unsafe， 外 部 的 使 用 者 可 以 随意 设置 动态 数组 的 大 
小 ， 那 么 用 户 可 以 将 其 大 小 突然 变 很 大 ， 然 后 就 可 以 通过 这 个 Vec 访 问 
本 不 该 属于 它 的 内 容 ， 这 就 造成 了 "内存 不 安全 ”的 情况 。 


所 以 ， 我 们 一 定 要 注意 的 是 : 判断 一 个 函数 是 否 应 该 是 一 个 unsafe 
图 数 ， 不 该 看 它 表 面 的 多 辑 ， 而 应 该 判断 用 户 使 用 它 的 时 候 造 成 的 影 
啊 。 


当 我 们 使 用 unsafe 代 码 块 的 时 候 ， 很 可 能 需要 一 些 对 safe 代 码 的 隐 
含 的 假设 和 依赖 ， 这 些 依赖 关系 既 不 能 通过 类 型 系统 同 编译 器 清楚 表 
达 ， 也 未 必 能 在 代码 中 明显 地 表现 出 来 。safe 代 码 有 义务 维持 unsafe 代 
码 相 对 应 的 假设 ，unsafe 代 码 中 也 要 注意 保持 一 致 性 。 如 果 这 些 假设 一 
旦 被 破坏 ， 那 这 个 库 的 安全 性 也 就 功 亏 一 筑 了 。 只 要 你 在 某 个 函数 内 部 
使 用 了 unsafe 代 码 块 ， 你 需要 关注 的 就 不 只 是 这 个 函数 的 正确 性 ， 还 有 
0 na 其 他 所 有 函数 的 正确 性 ， 它 们 是 互相 
影响 互相 搭配 的 。 


对 于 Vec 类 型 ， 我 们 需要 保证 任何 时 候 self.len 这 个 成 员 都 应 该 准确 
地 反映 它 内 部 的 成 员 个 数 。 这 个 要 求 ， 我 们 无 法 利用 类 型 系统 或 者 别 的 
什么 语言 特性 表达 出 来 。 因 为 这 个 成 员 赋 值 ， 可 能 是 安全 的 ， 也 可 能 是 
不 安全 的 ， 取 决 于 上 下 文 迎 辑 。 所 以 ， 这 个 方法 必须 用 unsafe 标 记 。 而 
用 户 在 使 用 的 时 候 ， 如 果 已 经 在 逻辑 上 保证 了 这 个 赋值 是 安全 的 ， 那 么 
就 可 以 在 那个 地 方 利 用 unsafe 代 码 块 调用 这 个 方法 ， 否 则 就 不 该 调用 。 




















再 举 个 例子 ， 我 们 使 用 unsafe 代 码 来 访问 数组 内 部 的 数据 : 





fn index(arr: &[u8], idx: usize) -> Option<u8> { 
if idx < arr.len() { 
unsafe { 
let p = arr.as ptr().offset(idx as isize); 
Some(*p) 


} 
} else { 
None 


} 


fn main() { 
let arr = [1,2,3,4,5]; 
println!i("{:?}", index(&arr, 3)); 
} 





基本 逻辑 很 简单 ， 通 过 裸 指针 的 算术 运算 ， 指 回 我 们 需要 的 目标 ， 
然后 将 数据 读 出 来 。 这 段 代码 将 不 安全 的 内 部 实现 和 安全 的 外 部 API 良 
好 地 结合 在 了 一 起 ， 是 符合 Rust 的 设计 思路 的 。 


在 这 个 例子 中 ， 如 宁 我 们 把 这 条 件 稍 作 改动 ， 变 成 : 


if idx <= arr.len() 


那么 这 个 函数 就 变 成 了 “不 安全 ”的 代码 ， 外 部 用 户 有 机 会 通过 安全 
代码 读 取 不 属于 这 个 数组 的 内 容 ， 而 且 编 译 器 检查 不 出 来 。 需 要 注意 的 
是 ， 我 们 这 里 只 修改 了 安全 代码 ， 但 它 制造 了 不 安全 现象 。 这 是 因为 我 
们 内 部 的 unsafe 语 句 块 中 ， 已 经 假定 了 idx 的 数值 是 合法 的 。 我 们 在 
unsafe 块 的 外 部 ， 就 需要 通过 逻辑 来 保证 这 一 点 ， 人 否则 就 是 bug。 


所 以 ， 基 于 unsafe 代 码 写 库 很 难 ， 难 就 难 在 你 不 仅 要 测试 正常 情况 
下 功能 的 正确 性 ， 还 必须 考虑 用 户 可 能 的 各 种 行为 是 否 有 可 能 在 safe 代 
码 中 利用 你 这 个 库 制 造 内 存 不 安全 。 在 C/C++ 中 ， 如 果 用 户 可 以 通过 一 
个 库 制 造 内 存 不 安全 ， 那 是 用 户 的 问题 ， 作 为 库 只 需要 提供 功能 就 足够 
了 ， 无 须 保 证 安全 性 ， 当 然 你 也 保证 不 了 ， 顶 多 也 就 < 防 君 子 不 防 小 
人 ”。 跟 C/C++ 相 比 ，Rust 提 供 的 保证 要 严格 得 多 ， 如 果 用 户 有 机 会 利用 
你 的 库 在 不 使 用 unsafe 关 键 字 的 情况 下 制造 出 “内 存 不 安全 ”， 那 这 个 库 
就 有 严重 bug， 是 低 质 量 的 、 不 可 接受 的 。 








20.5 ” 目 定 义 解 引 用 


继续 分 析 Vec 的 源码 。Vec 是 一 个 “动态 数组 ”"， 它 的 行为 应 该 尽量 与 
默认 的 定 长 数组 一 致 。 语 言 内 置 的 定 长 数组 支持 数组 切片 功能 ， 可 以 使 
用 一 个 Slice 作 为 指 同 数组 某 个 部 分 的 “视图 ”。 那 我 们 也 应 该 为 Vec 实 现 
这 样 的 功能 。 这 种 情况 我 们 需要 利用 Deref， 代 码 如 下 : 








impl<T> ops::Deref for Vec<T> { 
type Target = [T]; 


fn deref(&self) -> &[T] { 
unsafe { 
let p = self.buf.ptr(); 
assume( !p.is_null()); 
slice::from raw parts(p, self.1len) 
} 
} 
} 





Target 类 型 是 [T]， 这 意味 着 *Vec<T> 的 类 型 为 [T]， 所 以 &*Vec<T> 
的 类 型 为 &[T]。 


当 合 到 可 以“ 隐 式 上 自动 dere 刀 的 场景 时 ，&Vec<T> 类 型 如 果 不 匹配 ， 
编译 器 就 会 继续 尝试 &*Vec<T>， 即 &[T] 类 型 来 匹配 。 所 以 ， 我 们 就 可 
以 在 需要 &[T] 类 型 的 时 候 ， 直 接 使 用 &Vec<T>。 


Deref 在 许多 时 候 都 很 有 用 。 因 为 Deref 的 存在 ， 实 现 vec[..] 这 样 的 功 
能 很 简单 ， 因 为 编译 占 会 帮 我 们 实现 类 型 自动 转换 : 








impl<T> ops::Index<ops: :RangeFull> for Vec<T> { 
type Output = [T]; 


#[inline] 
fn index(&self, _index: ops::RangeFull) -> &[T] { 
self 
} 
} 





我 们 知道 self 的 类 型 是 &Vec<T>， 而 函数 定义 的 返回 类 型 是 &[T]， 
因为 有 Deref 的 存在 ， 编 译 器 会 玫 我 们 做 这 个 自动 类 型 转换 。 








再 比如 索引 Index 功 能 ， 其 内 部 实现 方式 就 是 先 deref 为 原生 数组 关 
型 ， 然 后 利用 内 置 数组 的 Index 功 能 实现 : 





impl<T> Index<usize> for Vec<T> { 
type Output = T; 


#[inline] 
fn index(&self, index: usize) -> &T { 
// NB built-in indexing via ‘&[T]. 
&(**self)[index] 
} 
} 





读者 看 到 (**self〉 的 时 候 不 要 惊 慨 ， 我 们 慢 慢 分 析 。self 类 型 是 
&rVec<T>， 因 此 *self 类 型 是 Vec<T>，**self 类 型 是 [T]。 因 此 这 句 话 的 意 
思 是 : 对 [TT] 执 行 Index 操 作 后 ， 再 把 引用 人 返回。 


20.6 ”迭代 器 


我 们 知道 ， 可 以 通过 Vec: : iter 〈) 方法 创建 一 个 动态 数组 的 迭代 

。 但 是 我 们 在 源码 中 却 没 有 见 到 这 个 方法 的 存在 。 这 是 因为 这 个 方法 

水 上 是 sce 型 的 方法 ，Vec 只 是 自动 deref 后 调用 了 原生 数组 的 迭代 
i Es 


但 是 ，Vec 类 型 本 身 也 是 可 以 用 于 for 循 环 中 的 : 








fn main() { 

let x = vec![0_ i32, 1, 2]; 

for item in x { println!("{}", item); } 
} 





这 是 因为 Vec 实 现 了 Intolterator trait。 标 准 库 中 的 IntoIterator 就 是 编 
译 右 留 下 来 的 一 个 扩展 内 置 for 循 环 语法 的 接口 。 任 何 自 定 义 类 型 ， 只 人 要 
合理 地 实现 了 这 个 trait， 就 可 以 被 用 在 内 置 的 for 循 环 里 面 。 关 于 迭代 上 喜 
的 更 多 内 容 ， 在 本 书 第 三 部 分 继续 讲述 


关于 返 代 器 ， 有 一 个 Vec: : drain 方 法 实现 得 比较 特殊 ， 这 里 专门 
拿 出 来 讲 一 下 。 它 的 功能 是 从 动态 数组 中 把 一 个 范围 的 数据 “ 移 除 ”出 
去 ， 返 回 的 还 是 一 个 “和 迭 代 器 ”?。 我 们 还 可 以 遍历 一 次 这 个 迭代 器 ， 使 用 
已 经 被 移 除 的 那些 元 素 。 示 例如 下 : 








fn main() { 
Jet mut origin = vec![90, 1, 2, 3, 4, 5]; 


println!("Removed:") 

for i in origin.drain(1..3) { 
println!("{}", 1); 

} 


println!("Left:"); 

for i in origin. iter() { 
println!("{}", i); 

} 


} 





drain 〈) 方法 返回 的 类 型 就 是 一 个 普通 的 迭代 器 ， 在 标准 库 中 ， 
个 方法 的 源码 如 下 所 示 : 


[EE | 


pub fn drain<R>(&mut self, range: R) -> Drain<T> 
where R: RangeArgument<usize> 


{ 
let len = Self.len()， 
let start = match range.start() { 
Included(&n) => n, 
Excluded(&n) => n+1, 
Unbounded => 0, 
}; 
let end = match range.end() { 
Included(&n) => n+1, 
Excluded(&n) => n, 
Unbounded => len, 
下 
assert!(start <= end ) ， 
assert!(end <= len) 
unsafe { 
self.set_len(start); 
let range_slice = slice::from raw parts mut(self.as mut_ptr().offset (st 
Drain { 
tail_start: end, 
tail_ len: len - end, 
iter: range_slice.iter(), 
vec: Shared::from(self), 
} 
} 
} 





返回 的 这 个 Drain 类 型 实现 了 Tterator trait， 上 有 具体 源码 就 不 详细 列 出 
了 。 总 之 授 历 Drain 这 个 迭代 占 ， 会 把 所 有 应 该 说 删除 的 元 素 裔 历 一 
裔 。 而 Drain 类 型 还 实现 了 一 个 析 构 函数 。 当 它 目 己 被 销毁 的 时 候 ， 它 
0 把 这 些 应 该 被 删除 的 元 素 从 原始 数组 中 真 
删 挥 。 


大 致 原理 就 是 这 样 。 特 别 需 要 注意 的 是 ， 在 Vec: : drain 方 法 中 创 
建 迭 代 器 之 前 ， 先 调用 了 self.set_len (start) 方法 。 那 么 这 个 设置 的 目 
的 是 什么 呢 ? 

这 个 设计 实际 上 是 为 了 防止 男 一 种 情况 下 的 内 存 不 安全 。 


我 们 假设 用 户 写 了 这 样 的 代码 : 





fn main() { 
let mut origin = veci![ 
"QO".to_string(), "1".to_string(), "2".to_string(), 
"3",.to_string(), "4".to_string(), "5".to_string()]; 


let mut d = origin.drain(1..3); 
let s: Option<String> = d.next(); 
println!("{:?}", Ss); 
let s: option<string> = = d.next(); 
printjn!i("{:?}", 
let s: optionxstring> = = d.next(); 
println!("{:?}", Ss); 
std: :mem: :forget (d); 

} 


println!("Left:"); 
for i In origin. > : 
printjn!i("{:?}", 


前 面 讲 泄露 的 时 候 已 经 说 过 了 ，std: : mem: : forget 函 数 是 不 带 
unsafe 修 饰 的 。 它 可 以 阻止 一 个 类 型 的 析 构 函数 调用 ， 析 构 函 数 是 不 能 
保证 一 定 会 被 调用 的 。 在 这 种 情况 下 ，Drain 类 型 没有 机 会 执行 它 的 析 
构 函 数 ， 所 以 它 没 有 机 会 修改 原始 的 Vec， 把 数据 从 Vec 中 移 除 。 


假设 没有 self.set_len (start) ; 这 个 函数 调用 ， 在 上 面 的 例子 中 会 
出 现 某 些 字 符 串 元 素 已 经 被 Drain 迭 代 器 取出 来 消费 把 了 ， 但 是 Vec 中 还 
存 有 一 份 “副本 ， 而 这 个 副本 本 身 处 于 一 种 术 急 始 化 状态 ”， 它们 从 逐 
辑 上 已经 被 移 走 了 ， 但 依然 被 认为 是 Vec 的 正常 数据 。 这 是 典型 的 内 存 
不 安全 的 情况 。 


所 以 ， 在 标准 库 中 ，drain 〈) 方法 内 部 在 返回 迭代 需 之 前 ， 先 把 当 
前 Vec 的 大 小 设置 为 一 个 比较 小 的 绝对 安全 的 值 。 如 果 说 这 个 drain 〈) 
方法 返回 的 迭代 器 因为 茶 种 原因 未 能 成 功 析 构 ， 那 么 最 坏 的 结果 也 束 
古 ， 原 数组 中 仅 剩 下 Jstart 之 前 的 元 素 。 至 少 我 们 可 以 衣 定 ， 任 何 情况 
下 ， 数 组 中 的 数据 都 是 符合 “内 存 安全 ”的 。 如 果 这 个 达 代 器 的 析 构 函数 
成 功 执行 了， 那么 end 之 后 的 元 素 会 同 前 移动 ， 数 组 的 长 度 会 被 重 置 ， 
这 时 候 这 个 逻辑 才 算 执行 完整 。 


析 构 函数 泄漏 绝对 不 是 我 们 期 望 发 生 的 事情 ， 我 们 只 是 无 法 阻止 这 
种 情况 而 已 。 所 以 ， 在 写 库 的 时 候 要 注意 ， 我 们 的 底线 是 ， 即 便 析 构 函 
数 泄漏 会 导致 逻辑 错误 ， 也 不 会 发 生 “ 内 存 不 安全 ”。 














20.7 panic safety 


在 利用 unsafe 写 库 的 时 候 ， 还 需要 注意 的 一 点 是 “panic 安 全 ”。panic 
在 什么 情况 下 发 生 是 难以 预测 的 ， 我 们 要 做 的 是 ， 即 便 在 发 生 panic 的 时 
候 ， 也 能 保证 <“ 内存 安 全 ”。 


我 们 以 Vec: : truncate 方 法 为 例 来 说 明 “panic 安 全 ”是 怎么 做 到 的 。 
这 个 方法 用 于 把 数组 切 挥 一 部 分 ， 只 保留 前 面 的 部 分 ， 后 面 的 部 分 扔 
控 。 所 以 ， 我 们 可 以 想到 的 实现 逻辑 应 该 是 针对 被 切 挥 的 部 分 ， 每 个 元 
素 调 用 一 下 析 构 函数 ， 最 后 重新 设置 一 下 数组 的 长 上 度 大 小 即 可 。 


可 惜 这 么 做 是 不 对 的 。 因 为 “对 象 的 析 构 函数 ”是 用 户 自 定义 的 行 
为 ， 在 这 个 方法 里 面 会 执行 什么 逻辑 是 无 法 提前 确定 的 。 所 以 ， 我 们 应 
该 假设 它 有 可 能 发 生 panic。 如 末 有 对 象 已 经 执行 了 析 构 ， 但 是 还 继续 把 
它 留 在 数组 里 面 ， 等 待 数组 最 后 来 重新 设置 长 度 ， 是 有 风险 的 。 所 以 标 
准 库 里 面 的 代码 是 这 么 做 的 : 每 次 执行 析 构 前 先 把 数组 长 度 减 1， 从 逻 
辑 上 将 元 素 从 数组 中 移 除 ， 然 后 执行 析 构 函数 。 源 码 如 下 所 未 : 








pub fn truncate(&mut self, len: usize) { 
unsafe { 

// drop any extra elements 

while len < self.len { 
// decrement len before the drop_in place(), so a panic on Drop 
// doesn't re-drop the just-failed value. 
self.len -= 1; 
let len = self.1len,; 
ptr::drop_in_place(self.get_ unchecked mut(len)); 


所 以 ， 大 家 在 读 源码 的 时 候 ， 不 仪 要 看 到 别人 是 这 样 写 的 ， 更 要 看 
到 别人 为 什么 不 会 那样 写 。 这 上 段 代 码 看 起 来 好 像 不 够 优化 ， 在 每 次 循环 
的 时 候 减 1， 却 没有 在 循环 前 或 者 后 面 一 次 性 减 掉 lan。 这 样 做 是 有 原因 
的 。 请 读者 仔细 理解 源码 中 的 那 条 注释 。 同 样 的 道理 ， 类 似 的 保障 异 各 
安全 的 设计 ， 我 们 还 可 以 在 extend_with 等 方法 中 看 到 。 这 个 方法 是 实现 
resize、resize_default 等 方法 的 基础 。 








impl<T> Vec<T> { 


/// Extend the vector by ‘n values, using the given generator. 
fn extend with<E: Extendwith<T>>(&mut self, n: usize, value: E) { 
self.reserve(n); 
unsafe { 
let mut ptr = self.as_ mut_ptr().offset(self.len() as isize); 
// Use SetLenonDrop to work around bug where compiler 
// may not realize the store through ptr ” ”through self.set_len() 
// don't alias ， 
let mut local len = SetLenonDrop: :new(&mut self.1len); 


// Write all elements except the last one 
for _ in 1..n { 
ptr::write(ptr, value.next()); 
ptr = ptr.offset(1); 
// Increment the length in every step in case next() panics 
local len.increment_len(1); 


} 


if n>0f 
// We can write the last element directly without cloning needless]l, 
ptr::write(ptr, value.1last()); 
local len.increment_len(1); 


// len set by scope guard 








这 个 方法 是 往 Vec 后 面 继 续 扩 展 n 个 元 素 ， 这 n 个 元 素 可 以 是 通过 一 
个 元 素 clone () 而 来 ， 也 可 以 是 调用 Default: : () 构造 而 来 。 


大 家 可 以 注意 到 ， 在 真正 写 入 数据 之 前 ， 先 创建 了 一 个 
SetLenOnDrop 类 型 的 变量 local_len， 男 外 每 次 写 入 一 个 新 的 元 素 之 后 ， 
都 会 将 这 个 变量 重新 设置 长 度 。 而 这 个 SetLenOnDrop 类 性 的 主要 切 能 ， 
就 是 在 析 构 的 时 候 修 改 Vec 的 真正 长 度 。 因 为 在 这 上段 unsafe 代 码 中 ， 需 
要 调用 value.next() 方法 ， 而 这 个 方法 最 后 会 调用 到 元 素 的 T: : 
default〈) 或 者 T: : clone() 方法 。 这 些 方法 的 实现 ， 取 决 于 外 部 元 
素 类 型 的 实现 ， 它 们 会 不 会 导致 panic， 写 容器 的 作者 是 不 知道 的 。 因 
此 ，Vec 容 器 的 作者 只 能 假定 这 些 外 部 方法 是 有 panic 风 险 的 。 为 了 保证 
在 发 生 panic 之 后 Vec 内 部 包含 的 依然 是 合 法 数据 ， 一 定 要 每 次 成 功 写 入 

个 元 素 之 后 ， 马 上 更 新 长 度 信息 。 








第 三 部 分 “高 级 抽象 


Rust 既 有 面 问 硬件、 面 癌 确 层 、 执 行 效率 高 的 特点 ， 也 有 面 癌 封 
装 、 面 向 抽象 、 表 达能 力 强 的 特点 。 本 部 分 主要 讲解 Rust 提 供 的 一 系列 
高 级 抽象 工具 。 


第 21 章 ” 泛 型 


泛 型 〈Generics) 是 指 把 类 型 抽象 成 一 种 “参数 ”"， 数 据 和 算法 都 针 
对 这 种 抽象 的 类 型 参数 来 实现 ， 而 不 针对 具体 类 型 。 当 我 们 需要 真正 使 
用 的 时 候 ， 再 有 具体 化 、 实 例 化 类 型 参数 。 


21.1 ”数据 结构 中 的 泛 型 
有 时 候 ， 我 们 需要 针对 多 种 类 型 进行 统一 的 抽象 ， 这 就 是 泛 型 。 泛 
型 可 以 将 “类 型 "作为 参数 ， 在 函数 或 者 数据 结构 中 使 用 。 


再 以 我 们 熟悉 的 Option 类 型 举例 。 它 就 是 一 个 泛 型 enum 类 型 ， 其 参 
数 声 明 在 尖 括 号 <> 中 。 








enum Option<T> { 
Some(T), 
None, 


} 





这 里 的 <T> 实 际 上 是 声明 了 一 个 “类 型 ”参数 。 在 这 个 Option 内 部 ， 
Some (T) 是 一 个 tuple struct， 包 含 一 个 元 素 类 型 为 T。 这 个 泛 型 参数 类 
型 T， 可 以 在 使 用 时 指定 具体 类 型 。 





lJet x: Option<i32> = Some(42); 
let y: Option<f64> = None,; 





在 上 述 第 一 行 代码 中 ， 泛 型 参数 T 被 具体 化 成 了 i32，x 的 类 型 ， 在 
这 里 是 Option<i32>; 在 第 二 行 代 码 中 ， 泛 型 参数 T 被 具体 化 成 了 f64，y 
的 类 型 ， 在 这 里 是 Option<f64>。 


泛 型 参数 可 以 有 多 个 也 可 以 有 默认 值 。 比 如 : 





Struct S<T=i32> { 
data: T 
} 


fn main() { 
let vi = S { data: 0}; 
let v2 = S::<bool> { data: false}; 
println!("{} {}", vi.data, v2.data); 
} 





对 于 上 例 中 的 泛 型 参数 T， 我 们 可 以 在 使 用 的 时 候 不 指定 类 型 参 
数 。 如 果 不 指定 的 话 ， 参 数 默认 为 32， 也 可 以 在 使 用 的 时 候 指 定 为 其 


使 用 不 同类 型 参数 将 泛 型 类 型 具体 化 后 ， 获 得 的 是 完全 不 同 的 具体 
类 型 。 如 Option<i32> 和 Option<i64> 是 完全 不 同 的 类 型 ， 不 可 通用 ， 也 
不 可 相互 转换 。 当 编译 器 生成 代码 的 时 候 ， 它 会 为 每 一 个 不 同 的 泛 型 参 
数 生成 不 同 的 代码 。 


各 种 上 自 定 义 复合 类 型 都 可 以 携带 任意 的 泛 型 参数 。Rust 规 定 ， 所 有 
的 泛 型 参数 必须 是 真 的 被 使 用 过 的 。 下 面 的 代码 就 会 报错 : 





Struct Num<T> { 
data: i32 
} 





这 个 结构 体 声明 了 一 个 泛 型 参数 ， 但 是 却 并 没有 使 用 它 。 编 译 器 会 
对 这 个 问题 报错 ， 说 有 泛 型 参数 从 来 没有 使 用 过 。 按 下 和 面 这 样 写 束 没 有 


问题 了 : 


Struct Num<T> { 
data: Option<T> 
} 





21.2 ”图 数 中 的 谤 型 


泛 型 可 以 使 用 在 函数 中 ， 语 法 类 似 : 





fn compare_option<T>(first: Option<T>, second: Option<T>) -> bool 


match(first, second) { 
(Some(..), Some(..)) => true, 
(None, None) => true, 
_ => false 





在 上 面 这 个 例子 中 ， 函 数 compare_option 有 一 个 泛 型 参数 T， 两 个 形 
参 类 型 均 为 Option<T>。 这 意味 着 这 两 个 参数 必须 是 完全 一 致 的 类 型 。 
如 末 我 们 在 参数 中 传 入 两 个 不 同 的 Option， 会 导致 编译 错误 : 





fn main() { 
println!("{}"，compare_option(Some(1i32)，Some(1.0f32))); // 类 型 不 匹配 编译 错误 











编译 器 在 看 到 这 个 函数 调用 的 时 候 ， 会 进行 类 型 检查 : first 的 形 参 
类 型 是 Option<T>、 实 参 类 型 是 Option<i32>，second 的 形 参 类 型 是 
Option<T>、 实 参 类 型 是 Option<f32>。 这 时 编译 器 的 类 型 推导 功能 会 进 
行 一 个 类 似 解 方程 组 的 操作 : 由 Option<T>==Option<i32> 可 得 T==i32， 
而 由 Option<T>==Option<f32> 叉 可 得 T==f32。 这 两 个 结论 产生 了 矛盾 ， 
因此 该 方程 组 无 解 ， 出 现 编译 错误 。 


人 以 接受 两 个 不 同 的 类 型 ， 那 么 需要 使 用 两 个 泛 








fn compare_option<T1, T2>(first: Option<T1i>, second: Option<T2>) -> bool { ... } 





一 般 情 况 下 ， 调 用 泛 型 函数 可 以 不 指定 泛 型 参数 类 型 ， 编 译 右 可 以 
通过 类 型 推导 自动 判断 。 某 些 时 候 ， 如 果 确 实 需要 手动 指定 泛 型 参数 类 
型 ， 则 需要 使 用 function_name: : <type params> (function params) 的 
语法 : 





compare_option: :<i32, f32>(Some(1), Some(1.0)); 





泛 型 函数 在 很 大 程度 上 实现 了 C++ 的 “函数 重 载 ”功能 。 比 如 ，str 类 
型 有 一 个 contains 方 法 ， 使 用 示例 如 下 : 





fn main() { 
let s = "hello"; 
println!("{}", Ss.contains('a')); 
println!("{}", Ss.contains("abc")); 
println!i("{}", Ss.contains(&['H'] as &[char])); 
println!i("{}", Ss.contains(|c : char| c.len utf8() > 2)); 
} 





我 们 可 以 看 到 ， 这 个 contains 方 法 可 以 接受 很 多 种 不 同 的 参数 类 
I 那么 它 是 怎么 实现 的 呢 ? 主 要 技术 就 是 泛 型 。 它 
签名 如 下 : 





fn contains<'a, P: Pattern<'a>>(&'a self, pat: P) -> bool 








可 见 ， 它 的 第 二 个 参数 不 是 某 个 具体 类 型 ， 而 是 一 个 泛 型 类 型 ， 而 
日 这 个 泛 型 参数 满足 Pattern trait 的 约束 。 这 意味 着 ， 所 有 实现 了 Pattern 
trait 的 类 型 ， 都 可 以 作为 参数 使 用 。 我 们 希望 这 个 参数 接受 哪些 类 型 ， 
就 针对 这 个 类 型 实现 这 个 trait 即 可 。 


Rust 没 有 C++ 那 种 无 限制 的 ad hoc 式 的 函数 重 载 功能 。 现 在 没有 ， 
将 来 也 不 会 有 。 主 要 原因 是 ， 这 种 随意 的 函数 重 载 对 于 代码 的 维护 和 可 
读 性 是 一 种 伤害 。 通 过 泛 型 来 实现 类 似 的 功能 是 更 好 的 选择 。 如 果 说 ， 
不 同 的 参数 类 型 ， 没 有 办 法 用 trait 统 一 起 来 ， 利 用 一 个 函数 体 来 统一 实 
现 功 能 ， 那 么 它们 束 没 必要 共用 同一 个 函数 名 。 它 们 的 区 别 已 经 足够 
大 ， 所 以 理应 使 用 不 同 的 名 字 。 强 行使 用 同一 个 函数 名 来 表示 区 别 非 党 
大 的 不 同 函 数 逻 辑 ， 并 不 是 好 的 设计 。 


我 们 还 有 为 外 一 种 方案 ， 可 以 把 不 同 的 类 型 统一 起 来 ， 那 就 是 
enum。 通 过 enum 的 不 同 成 员 来 携带 不 同 的 类 型 信息 ， 也 可 以 做 到 类 
似 “函数 重 载 ?的 功能 。 但 这 种 做 法 跟 * 函 数 重 载 2? 有 本 质 区 别 ， 因 为 它 是 
有 运行 时 开销 的 。enum 会 在 执行 阶段 判断 当前 成 员 是 哪个 变 体 ， 而 “ 函 
数 重 载 ”以 及 泛 型 函数 部 是 在 编译 阶段 静态 分 派 的 。 同 样 ，Rust 也 不 或 














励 大 家 仅仅 为 了 省 去 命名 的 麻烦 ， 而 强行 把 不 同类 型 用 enum 统 一 起 来 
用 一 个 函数 来 实现 。 如 果 一 定 要 这 么 做 ， 那 么 最 好 是 有 一 个 好 的 理由 ， 
而 不 仅 古 因为 懒得 给 函数 命名 而 已 。 


21.3 impl 块 中 的 泛 型 


impl 的 时 候 也 可 以 使 用 泛 型 。 在 impl<Trait>for<Type>{} 这 个 语法 结 
构 中 ， 泛 型 类 型 既 可 以 出 现在 <Trait> 位 置 ， 也 可 以 出 现在 <Type> 位 
置 。 


与 其 他 地 方 的 泛 型 一 样 ，impl 块 中 的 泛 型 也 是 先 声 明 再 使 用 。 在 
impl 块 中 出 现 的 泛 型 参数 ， 需 要 在 impl 关 键 字 后 面 用 尖 括 号 声明 。 


当 我 们 希望 为 某 一 组 类 型 统一 impl 某 个 trait 的 时 候 ， 泛 型 就 非常 有 
用 了 。 有 了 这 个 功能 ， 很 多 时 候 就 没 必 要 单独 为 每 个 类 型 去 重复 impl 
了 。 以 标准 库 中 的 代码 为 例 : 











impl<T, U> Into<U> for T 
where U: From<T> 


fn into(self) -> Ut 
U::from(self) 
} 
} 





上 面 这 段 代码 中 ，impl 关 键 字 后 面 的 尖 括 写 <T，U> 意 思 古 先 声 明 
两 个 泛 型 参数 ， 后 面 会 使 用 它们 。 这 跟 类 型 、 函 数 中 的 泛 型 参数 规则 一 
样 ， 先 声明 、 后 使 用 。 


标准 库 中 的 Into 和 From 是 一 对 功能 互 逆 的 trait。 如 果 A: Into<B>， 
意味 着 B: From<A>。 因 此 ， 标 准 库 中 写 了 这 样 一 段 代 码 ， 意 思 是 针对 
所 有 类 型 T， 只 要 满足 U: From<T>， 那 么 就 针对 此 类 型 impl Into<U>。 
有 了 这 样 一 个 impl 块 之 后 ， 我 们 如 果 想 为 自己 的 两 个 类 型 提供 互相 转换 
的 功能 ， 那 么 只 需 impl From 这 一 个 trait 就 可 以 了 ， 因 为 反 过 来 的 Into 
trait 标 准 库 已 经 帮忙 实现 好 了 。 





21.4 泛 型 参数 约束 


Rust 的 泛 型 和 C++ 的 template 非 常 相 似 ， 但 也 有 很 大 不 同 。 它 们 的 最 
大 区 别 在 于 执行 类 型 检查 的 时 机 。 在 C++ 里 面 ， 模 板 的 类 型 检查 是 延迟 
示例 如 下 : 














// C++ template 示例 

template <class T> 

const T& max (const T& a, const T& b) { 
return (a<b)?b:a; 

} 


void instantiateInt() { 
int m = max(1, 2); // 实例 化 1 
} 


Struct T { 
int value; 
}; 


void instantiateT() { 
T t1i { value: 1}; 
T t2 { value: 2}; 
//T m = max(t1，t2); // 实例 化 2 


int main() { 
instantiateInt(); 


instantiateT( ) ， 
return ©; 





在 这 个 例子 中 ， 如 果 我 们 把 “实例 化 2? 处 的 代码 先 注释 掉 ， 使 用 
g++-std=c++11 test.cpp 命 令 编译 ， 可 以 通过 ， 如 果 取 消 注释 ， 则 编译 不 
通过 。 编 译 错误 为 ; 








error: no match for 'operator<' (operand types are 'const T' and 'const T') 








出 现 编译 错误 的 原因 是 我 们 没有 给 T 类 型 提供 比较 运算 符 重 载 。 此 
处 的 关键 在 于 ， 如 果 我 们 用 int 类 型 来 实例 化 max 函 数 ， 它 就 可 以 通过 ; 
如 果 我 们 用 自 定义 的 T 类 型 来 实例 化 max 函 数 ， 它 就 通 不 过 。max 函 数 本 





吴 一 直 都 是 没有 问题 的 。 也 就 是 说 ， 编 译 喜 在 处 理 max 冰 数 的 时 候 ， 根 
本 不 去 管 a<b 是 不 是 一 个 合理 的 运算 ， 而 是 将 这 个 检查 留 给 后 面 实例 化 
的 时 候 再 分 析 。 


Rust 采 取 了 不 同 的 策略 ， 它 会 在 分 析 泛 型 函数 的 时 候 当 场 检查 类 型 
的 合法 性 。 这 个 检查 是 怎样 做 的 呢 ? 它 要 求 用 户 提 供 合 理 的 “ 泛 型 约 
束 ”。 在 Rust 中 ，trait 可 以 用 于 作为 “ 泛 型 约束 ”。 在 这 一 点 上 ，Rust 跟 CC# 
的 设计 是 类 似 的 。 上 例 用 Rust 来 号， 大 致 是 这 样 的 逻辑 : 














fn max<T>(a: T, b: T) ->T{ 
if a<bIft 
b 
} else { 
a 


} 
} 


fn main() { 
let m = max(1, 2); 
} 





编译 ， 出 现 编译 错误 : 





error[E0369]: binary operation ‘< cannot be applied to type °T. 
--> test.rs:2:8 


| 
ifa<b({ 


2 | 
| 人 A 人 A 人 人 人 
| 


note: an implementation of “std::cmp::PartialOrd. might be missing for TT. 








这 个 编译 错误 说 得 很 清楚 了 ， 由 于 泛 型 参数 T 没 有 任何 约束 ， 因 此 
编译 器 认为 a<b 这 个 表达 式 是 不 合理 的 ， 因 为 它 只 能 作用 于 支持 比较 运 
算 符 的 类 型 。 在 Rust 中 ， 只 有 impl 了 PartialOrd 的 类 型 ， 才 能 支持 比较 运 
算 符 。 修 复方 案 为 泛 型 类 型 T 添 加 泛 型 约束 。 

泛 型 参数 约束 有 两 种 语法 : 

(1) 在 泛 型 参数 声明 的 时 候 使 用 冒号 : 指定 ; 


(2) 使 用 where 子 句 指 定 。 





use std::cmp::Partialord 




















// 第 一 种 写法 : 在 泛 型 参数 后 面 用 冒号 约束 
fn max<T: Partialord>(a: T, b: T) -> T{ 
























































// 第 二 种 写法 , 在 后 面 单 独 用 where 子 句 指定 
fn max<T>(a: T, b: T) ->T 
where T: Partialord 





在 上 面 的 示例 中 ， 这 两 种 写法 达到 的 目的 是 一 样 的 。 但 是 ， 在 某 些 
情况 下 《比如 存在 下 文 要 讲解 的 关联 类 型 的 时 候 ) ，where 子 句 比 参数 
声明 中 的 冒号 约束 具有 更 强 的 表达 能 力 ， 但 它 在 泛 型 参数 列表 中 是 无 法 
表达 的 。 我 们 以 Iterator trait 中 的 函数 为 例 : 








trait Iterator { 
type Item; // Item 是 一 个 关联 类 型 


// 此 处 的 where 子 句 没 办 法 在 声明 泛 型 参数 的 时 候 写 出 来 


fn max(self) -> Option<Self::Item> 
where Self: Sized, Self::Item: Ord 
{ 


和 i 











它 要 求 Self 类 型 满足 Sized 约 束 ， 同 时 关联 类 型 Self: : Item 要 满足 
Ord 约 束 ， 这 是 用 冒号 语法 写 不 出 来 的 。 在 声明 的 时 候 使 用 冒号 约束 的 
地 方 ， 一 定 都 能 换 作 where 子 句 来 写 ， 但 是 反 过 来 不 成 立 。 男 外 ， 对 于 
比较 复杂 的 约束 条 件 ，where 子 句 的 可 读 性 明显 更 好 。 


在 有 了 *“ 泛 型 约束 ”之 后 ， 编 译 器 不 仅 会 在 声明 泛 型 的 地 方 做 类 型 检 
查 ， 还 会 在 实例 化 泛 型 的 地 方 做 类 型 检查 。 接 上 例 ， 如 果 疝 我 们 上 面 实 
现 的 那个 max 函 数 传递 日 定义 类 型 参数 : 











Struct T { 
value: i32 
} 


fn main() { 
let ti = T { value: 1}; 
let t2 = T { value: 2}; 
let m = max(t1i, t2); 

} 


ee | 





编译 ， 可 见 编 详 错误 : 





error[E0277]: the trait bound `T: std::cmp::Partialord ”is not satisfied 
--> test.rs:20:13 
20 let m = max(t1i, t2); 
AAA can't compare ` T with °T. 


help: the trait ‘std::cmp::PartialOrd. is not implemented for °°T. 
note: required by ‘max. 





这 说 明 ， 我 们 在 调用 max 函 数 的 时 候 也 要 让 参数 符合 “ 泛 型 约束 ”。 
因此 我 们 需要 impl PartialOrd for T。 完 整 代码 如 下 : 





use std::cmp::Partialord; 
use std::cmp::Ordering; 


fn max<T>(a: T, b: T) ->T 
where T: Partialord 


{ 
if a<bIft 
b 
} else { 
a 
} 
} 
Struct T { 
value: 1i32 
} 


impl Partialord for T { 
fn partial cmp(&self, other: &T) -> Option<Ordering> { 
self.value.partial cmp(&other .value) 
} 


} 


impl PartialEq for T { 
fn eq(&self, other: &T) -> bool { 
self.value == other.value 
} 


} 


fn main() { 
let ti = T { value: 1}; 
let t2 = T { value: 2}; 
let m = max(t1i, t2); 





由 于 标准 库 中 的 PartialOrd 继 承 了 PartialEq， 因 此 单独 实现 PartialOrd 
还 是 会 产生 编译 错误 ， 必 须 同时 实现 PartialEq 才 能 编译 通过 。 


21.5 “关联 类 型 


trait 中 不 仅 可 以 包含 方法 〈 包 括 静 态 方法 ) 、 常 量 ， 还 可 以 包含 “类 
型 ”*。 比如， 我 们 常见 的 迭代 器 Iterator 这 个 trait， 它 里 面 就 有 一 个 类 型 叫 
Item。 其 源码 如 下 : 





pub trait Iterator { 
type Item; 


} 





这 样 在 trait 中 声明 的 类 型 叫 作 “关联 类 型 ”(associated type) 。 关 联 
类 型 也 同样 是 这 个 trait 的 “ 泛 型 参数 ”"。 只 有 指定 了 所 有 的 泛 型 参数 和 关 
联 类 型 ， 这 个 trait 才 能 真正 地 具体 化 。 示 例如 下 在 泛 型 函数 中 ， 使 用 
Iterator 泛 型 作为 泛 型 约束 ) : 





use std::iter::Iterator; 
use std::fmt::Debug; 


fn use_iter<ITEM, ITER>(mut iter: ITER) 
where ITER: Iterator<Item=ITEM>, 
ITEM: Debug 


while let Some(i) = iter.next() { 
println!("{:?}", i); 
} 


} 


fn main() { 
let v: Vec<i32> = vec![1,2,3,4,5]; 
use_iter(v.iter()); 


} 





可 以 看 到 ， 我 们 希望 参数 是 一 个 沁 型 从 代 右 ， 可 以 在 约束 条 件 中 写 
Iterator<Item=ITEM>。 跟 普通 泛 型 参数 比 起 来 ， 关 联 类 型 参数 必须 使 用 
名 字 赋 值 的 方式 。 那 么 ， 关 联 类 型 跟 普 通 泛 型 参数 有 哪些 不 同 点 呢 ? 我 
们 为 什么 需要 关联 参数 呢 ? 


1. 可 读 性 可 扩展 性 
从 上 面 这 个 例子 中 我 们 可 以 看 到 ， 虽 然 我 们 的 函数 只 接受 一 个 参数 





iter， 但 是 它 却 需要 两 个 泛 型 参数 : 一 个 用 于 表示 迭 代 需 本 身 的 类 型 ， 
一 个 用 于 表示 迭代 需 中 包含 的 元 系 类 型 。 这 古 相对 元 余 的 写法 。 实 际 
上 ， 在 有 关联 类 型 的 情况 下 ， 我 们 可 以 将 上 面 的 代码 简化 ， 示 例如 下 : 








use std::iter::Iterator; 
use std::fmt::Debug; 
fn use_iter<ITER>(mut iter: ITER) 
where ITER: Iterator, 
ITER: :Item: Debug 


while let Some(i) = I Re { 
printjn!i("{:?2}", 


} 


fn main() { 
let v: Vec<i32> = vec![1,2,3,4,5]; 
use_iter(v.iter()); 





这 个 版 本 的 写法 相对 于 上 一 个 版 本 来 说 ， 泛 型 参数 明显 简化 了 ， 我 
们 只 需要 一 个 泛 型 参数 即 可 。 在 泛 型 约束 条 件 中 ， 可 以 写 上 ITER 符 合 
Iterator 约 束 。 此 时 ， 我 们 就 已 经 知道 ITER 存 在 一 个 关联 类 型 Tem， 可 以 
针对 这 个 ITER: : Item 再 加 一 个 约束 即 可 。 如 果 我 们 的 Iterator 中 的 Item 
类 型 不 是 关联 类 型 ， 而 是 普通 泛 型 参数 ， 束 没 办 法 进行 这 样 的 简化 了 。 


我 们 再 看 男 一 个 例子 。 假 如 我 们 想 设 计 一 个 泛 型 的 “图 ”类 型 ， 它 包 
含 “ 顶 反 ” 和 “ 边 ” 两 个 泛 型 参数 ， 如 果 我 们 把 它们 作为 普通 的 泛 型 参数 设 
计 ， 那 么 看 起 来 就 是 : 











trait Graph<N, E> { 
fn has_edge(&self, &N, &N) -> bool; 


} 





人 函数 ， 要 计算 一 个 图 中 两 个 项 点 的 距离 ， 它 的 





fn distance<N, E, G: Graph<N, E>>(graph: &6, start: &N, end: &N) -> uint { 


} 





我 们 可 以 看 到 ， 泛 型 参数 比较 多 ， 也 比较 及 烦 。 对 于 指定 的 Graph 
类 型 ， 它 的 顶点 和 边 的 类 型 应 该 是 固定 的 。 在 函数 签名 中 再 写 一 抽 其 实 
没什么 道理 。 如 果 我 们 把 普通 的 泛 型 参数 改 为 “关联 类 型 设计， 那么 数 
据 结 构 就 成 了 : 











trait Graph { 
type N; 
type E; 
fn has_edge(&self, &N, &N) -> bool; 


} 





对 应 的 ， 计 算 距 离 的 函数 签名 可 以 简化 成 : 








fn distance<G>(graph: &6, start: &G::N, end: &G::N) -> uint 
where G: Graph 
{ 


} 





由 此 可 见 ， 在 某 些 情况 下 ， 关 联 类 型 比 普通 泛 型 参数 更 具 可 读 性 。 
2:trait 的 impl 匹 配 规则 

泛 型 的 类 型 参数 ， 既 可 以 写 在 尖 括 号 里 面 的 参数 列表 中 ， 也 可 以 写 
这 两 种 写法 有 什么 区 别 呢 ? 我 们 用 一 个 示例 
来 演示 一 下 。 


假如 我 们 要 设计 一 个 trait， 名 字 叫 作 ConvertTo， 用 于 类 型 转换 。 那 
么 ， 我 们 就 有 两 种 选择 。 一 种 是 使 用 泛 型 类 型 参数 ; 








trait ConvertTo<T> { 
fn convert(&self) -> T; 


} 





为 一 种 是 使 用 关联 类 型 : 





trait ConvertTo { 

type DEST; 

fn convert(&self) -> Self::DEST; 
} 





在 这 两 种 设计 下 ， 
全 本 | 是 : 





impl ConvertTo<f32> for i32 { 
fn convert(&self) -> f32 { *self as f32 } 
} 





以 及 : 





Impl1 ConvertTo for i32 { 

type DEST = f32; 

fn convert(&self) -> f32 { *self as f32 } 
} 





到 目前 为 止 ， 这 两 种 设计 似乎 没什么 区 别 。 但 是 ， 假 如 我 们 想 继续 
增加 一 种 从 i32 类 型 到 f64 类 型 的 转换 ， 使 用 泛 型 参数 来 实现 的 话 ， 可 以 





impl ConvertTo<f64> for i32 { 
fn convert(&self) -> f64 { *self as f64 } 
} 





如 果 用 关联 类 型 来 实现 的 话 ， 就 不 能 通过 编译 了 : 





imp ConvertTo for i32 { 

type DEST = f64; 

fn convert(&self) -> f64 { *self as f64 } 
} 





错误 信息 为 : 





error: conflicting implementations of trait ‘ConvertTo for type ‘i32. 





由 此 可 见 ， 如 果 我 们 采用 了 “关联 类 型 ”的 设计 方案 ， 就 不 能 针对 这 
个 类 型 实现 多 个 impl。 在 编译 器 的 眼 里 ， 如 果 trait 有 类 型 参数 ， 那 么 给 
定 不 同 的 类 型 参数 ， 它 们 就 已 经 是 不 同 的 trait， 可 以 同时 针对 同一 个 类 


型 实现 impl。 如 采 trait 没 有 类 型 参数 ， 只 有 关联 类 型 ， 给 关联 类 型 指定 
不 同 的 类 型 参数 是 不 能 用 它们 针对 同一 个 类 型 实现 impl 的 。 


ConvertTo<f 32> ConvertITo<f64> 


impl impl 





ConvertTo{type 
DEST = £32} 


impl 


ConvertTo{type 
DEST = £64} 


impl 





21.6 ” 何 时 使 用 关联 类 型 


从 前 文中 大 家 可 以 看 到 ， 虽 然 关 联 类 型 也 是 类 型 参数 的 一 种 ， 但 它 
与 泛 型 类 型 参数 列表 是 不 同 的 。 我 们 可 以 把 这 两 种 泛 型 类 型 参数 分 为 两 


个 类 别 ， 

输入 类 型 参数 

输出 类 型 参数 

在 尖 括 号 中 存在 的 泛 型 参数 ， 是 输入 类 型 参数 ， 在 trait 内 部 存在 的 
关联 类 型 ， 是 输出 类 型 参数 。 答 入 类 型 参数 是 用 于 决定 匹配 哪个 impl 版 
本 的 多数， 输出 类 型 参数 则 是 可 以 外 输入 类 型 参数 和 Salf 类 型 决 定 的 类 
型 参数 。 


继续 以 上 面 的 例子 为 例 ， 用 汉 型 参数 实现 的 版 本 如 下 : 








trait ConvertTo<T> { 
fn convert(&self) -> T; 


} 


impl ConvertTo<f32> for i32 { 
fn convert(&self) -> f32 { *self as f32 } 
} 


impl ConvertTo<f64> for i32 { 
fn convert(&self) -> f64 { *self as f64 } 


fn main() { 
let i = 1 i32,; 
let f = i,.convert(); 
println!("{:?}", f); 





编译 的 时 候 ， 编 译 器 会 报错 : 





error: unable to infer enough type information about `_`; type annotations or generj 





因为 编译 器 不 知道 选择 使 用 哪 种 convert 方 法 ， 需 要 我 们 为 它 指定 一 


个 类 型 参数 ， 比 如 ;: 





let f : f32 = i.convert(); 
// 或 者 
let f = ConvertTo::<f32>::convert(&i); 








这 很 像 C++/Java 等 语言 中 存在 的 “函数 重 载 ?规则 。 我 们 可 以 用 不 同 
的 参数 类 型 实现 重 载 ， 但 是 不 能 用 不 同 的 返回 类 型 来 做 重 载 ， 因 为 编译 
而 不 是 依靠 返回 
I 类 型 。 


在 标准 库 中 ， 何 时 使 用 泛 型 参数 列表 、 何 时 使 用 关联 类 型 ， 实 际 上 
有 非常 好 的 示范 。 


以 标准 库 中 的 AsRef 为 例 。 我 们 希望 String 类 型 能 实现 这 个 trait， 而 
且 既 能 实现 String: : as_ref: : <str>() 也 能 实现 String: : as_ref: : 
<[u8]> 〈) 。 因 此 AsRef 必 须 有 一 个 类 型 参数 ， 而 不 是 关联 类 型 。 这 样 
impl AsRef<str>for String 和 impl AsRef<[u8]>for String 才 能 同时 存在 ， 互 
不 冲突 。 如 果 我 们 把 目标 类 型 设计 为 关联 类 型 ， 那 么 针对 任何 一 个 类 
型 ， 最 多 只 能 impl 一 次 ， 这 就 失去 AsRef 的 意义 了 。 


我 们 再 看 标准 库 中 的 Deref trait。 我 们 希望 一 个 类 型 实现 Deref 的 时 
候 ， 最 多 只 能 impl 一 次 ， 解 引用 的 目标 类 型 是 唯一 固定 的 ， 不 要 让 用 户 
在 调用 obj.deref () 方法 的 时 候 指定 返回 类 型 。 因 此 Deref 的 目标 类 型 应 
该 设计 为 “关联 类 型 ”>。 人 否则 ， 我 们 可 以 为 一 个 类 型 实现 多 次 Deref， 比 如 
impl Deref<str>for String 和 impl Deref<char>for String， 那 么 针对 String 类 
型 做 解 引用 操作 ， 在 不 同 场景 下 可 以 有 不 同 的 结果 ， 这 显然 不 是 我 们 项 
望 看 到 的 。 解 引用 的 目标 类 型 应 该 由 Self 类 型 唯一 确定 ， 不 应 该 在 被 调 
用 的 时 候 被 其 他 类 型 干扰 。 这 种 时 候 应 使 用 关联 类 型 ， 而 不 是 类 型 参 
数 。 关 联 类 型 是 在 impl 阶 段 确定 下 来 的 ， 而 不 是 在 函数 调用 阶段 。 这 样 
才 是 最 符合 我 们 需求 的 写法 。 


还 有 一 些 情况 下 ， 我 们 既 需 要 类 型 参数 ， 也 需要 关联 类 型 。 比 如 标 
准 库 中 的 各 种 运算 符 相 关 的 trait。 以 加 法 运算 符 为 例 ， 它 对 应 的 trait 为 
std: : ops: : Add, 定义 为 : 














trait Add<RHS=Self> { 
type Output; 


fn add(self, rhs: RHS) -> Self: :Output 


在 这 个 trait 中 , “加 数 ?类 型 为 Self, “被 加 数 ? 类 型 被 设计 为 类 型 参数 
RHS， 它 有 默认 值 为 Self， 求 和 计算 结果 的 类 型 被 设计 为 天 联 类 型 
Output。 用 前 面 所 讲解 的 思路 来 分 析 可 以 有 发现 ， 这 样 的 设计 是 最 合理 的 
方式 。“ 被 加 数 ?类 型 在 泛 型 参数 列表 中 ， 因 此 我 们 可 以 为 不 同 的 类 型 实 
现 Add 加 法 操作 ， 类 型 A 可 以 与 类 型 B 相 加 ， 也 可 以 与 类 型 C 相 加 。 而 计 
算 结果 的 类 型 不 能 是 泛 型 参数 ， 因 为 它 是 被 Salf 和 RHS 所 唯一 固定 的 。 
它 需 要 在 impl 阶 段 就 确定 下 来 ， 而 不 是 等 到 函数 调用 阶段 由 用 户 指定 ， 
古典 型 的 “输出 类 型 参数 ”。 


21.7 疙 型 特 化 

Rust 语 言 支持 泛 型 特 化 ， 但 还 处 于 开发 过 程 中 ， 目 前 只 能 在 最 新 的 
nightly 版 本 中 试用 一 些 基 本 功能 。 

Rust 不 支持 函数 和 结构 体 的 特 化 。 它 支持 的 是 针对 impl 块 的 特 化 。 
我 们 可 以 为 一 组 类 型 impl 一 个 trait， 同 时 为 其 中 一 部 分 更 特殊 的 类 型 


impl 同 一 个 trait。 


示例 如 下 : 














#![feature(specialization)] 
use std::fmt::Display; 


trait Example { 
fn call(&self); 
} 


impl<T> Example for T 


default fn call(&self) { 
println!("most generic"),; 


} 


impl<T> Example for T 
where T: Display 


default fn call(&self) { 
println!("generic for Display, {}", self); 


} 


imp Example for str { 
fn call(&self) { 
println!("specialized for str, {}", self); 


} 


fn main() { 
let vi = vec![1i32,2,3]; 
Jet v2 = 1 i32; 
let v3 = "hello"; 


v1i.call(); 


v2.call(); 
v3.call(); 


一 一 | 


用 nightly 厂 本 编译 ， 执 行 ， 结 果 为 : 





most generic 
generic for Display, 1 
specialized for str, hello 








这 段 代 人 码 中 有 三 个 impl 块 。 第 一 个 是 针对 所 有 类 型 实现 Example。 
第 二 个 是 针对 所 有 的 满足 T: Display 的 类 型 实现 Example。 第 三 个 是 针 
对 具体 的 str 类 型 实现 Example。 一 个 比 一 个 更 具体 ， 更 特 化 。 


对 于 主 程序 中 vl.cal () ; 调用 ， 因 为 Vec<i32> 类 型 只 能 匹配 第 一 
个 imnpl 块 ， 因 此 它 调 用 的 是 最 基本 的 版 本 。 对 于 主 程序 中 的 
v2.call () ; 调用 ， 因 为 让 2 类 型 满足 Display 约 束 ， 所 以 它 同 时 满足 第 一 
个 或 者 第 二 个 impl 块 的 实现 版 本 ， 而 第 二 个 impl 块 比 第 一 个 更 具体 、 更 
匹配 ， 所 以 编译 器 选择 了 调用 第 二 个 impl 块 的 版 本 。 而 对 于 
Vv3.cal () ; 这 人 句 人 代码， 实际 上 三 个 impl 块 都 能 和 str 类 型 相 匹 配 ， 但 是 
第 三 个 impl 块 明显 比 其 他 两 个 impl 块 更 特 化 ， 因 此 在 主 程序 中 调用 的 时 
候 ， 选 择 了 执行 第 三 个 imp] 块 提供 的 版 本 。 


在 这 个 示例 中 ， 前 面 的 impl 块 针对 的 类 型 范围 更 广 ， 后 面 的 impl 块 
针对 的 类 型 更 具体 ， 它 们 针对 的 类 型 集合 是 包含 关系 ， 这 就 是 特 化 。 当 
编译 露 发现， 针对 东 个 类 型 ， 有 多 个 imp] 能 满足 条 件 的 时 候 ， 它 会 自动 
选择 使 用 最 特殊 、 最 匹配 的 那个 版 本 。 

















21.7.1 特 化 的 意义 


在 RFC 1210 中 ， 作 者 列 出 了 泛 型 特 化 的 三 个 意义 : 


1. 性 能 优化 。 泛 型 特 化 可 以 为 东 些 情况 提供 统一 抽象 下 的 特殊 实 
现 。 


2. 代 码 重用 。 泛 型 特 化 可 以 提供 一 些 默 认 但 不 完整 的 ) 实现 ， 茶 
些 情况 下 可 以 减少 重复 代码 。 


3. 为 "高效 继承 ”铺路 。 泛 型 特 化 其 实 跟 OOP 中 的 继承 很 像 。 
下 面 拿 标准 库 中 的 代码 举例 说 明 。 








标准 库 中 存在 一 个 ToString trait， 和 定义 如 下 : 





pub trait ToString { 
fn to_string(&self) -> String; 
} 





凡是 实现 了 这 个 trait 的 类 型 ， 都 可 以 调用 to_string 来 得 到 一 个 String 
类 型 的 结果 。 同 时 ， 标 准 库 中 还 存在 一 个 std: : fmt: : Display trait， 
也 可 以 做 到 类 似 的 事情 。 而 且 Display 是 可 以 通过 #[derive (Display) ] 由 
编译 占 上 自动 实现 的 。 所 以 ， 我 们 可 以 想到 ， 针 对 所 有 满足 T: Display 的 
类 型 ， 我 们 可 以 为 它们 提供 一 个 统一 的 实现 : 








impl<T: fmt::Display + ?Sized> ToString for T { 
#[inline] 
fn to_string(&self) -> String { 
use core::fmt::Write; 
let mut buf = String: :new(); 


let = buf .write_fmt(format_args!("{}", self)); 
buf. shrink_ to_fit(); 
buf 





这 样 一 来 ， 我 们 就 没 必要 针对 每 一 个 具体 类 型 来 实现 ToString。 这 
么 做 ， 非 常 有 利于 代码 重用 ， 所 有 满足 T: Display 的 类 型 ， 都 自动 拥有 
了 to_string 方 法 ， 不 必 一 个 个 地 手动 实现 。 这 样 做 代码 确实 简洁 了 ， 但 
是 ， 对 于 某 些 类 型 ， 比 如 &str 类 型 想 调 用 to_string 方 法 ， 效 率 就 有 点 差 
强人 意 了 。 因 为 这 段 代码 针对 的 是 所 有 满足 Display 约 束 的 类 型 来 实现 
的 ， 它 调用 的 是 fmt 模 块 的 功能 ， 内 部 实现 非常 复杂 而 烦琐 。 如 果 我 们 
用 &str 类 型 调用 to_string 方 法 的 话 ， 还 走 这 么 复杂 的 一 套 逻 辑 ， 上 略 显 多 
余 。 A 么 在 早期 的 Rust 代 码 中 ，&str 转 为 String 类 型 比较 推荐 以 
下 方式 : 








// 推荐 

let x : String = "hello".into(); 

// 推荐 

Jet x : String = String::from("hello"); 
// 不 推荐 , 因为 效率 1 


























Jet x : string = = "hello".to_string(); 





现在 有 了 泛 型 特 化 ， 这 个 性 能 问题 就 可 以 得 到 修复 了 ， 方 采 如 下 : 


impl<T: fmt::Display + ?Sized> ToString for T { 
#[inline] 
default fn to_string(&self) -> String { 


} 
} 


impl ToString for str { 
#[inline] 
fn to_string(&self) -> String { 
String::from(self) 
} 
} 





我 们 可 以 为 那个 更 通用 的 版 本 加 一 个 default 标 记 ， 然 后 再 为 str 类 型 
专门 写 一 个 特殊 的 实现 。 这 样 ， 对 外 接口 依然 保持 统一 ， 但 内 部 实现 有 
所 区 别 ， 尽 可 能 地 提高 了 效率 ， 满 足 了 “ 零 开销 抽象 ”的 原则 。 


21.77，default 上 下 文 关键 字 


我 们 可 以 看 到 ， 在 使 用 泛 型 特 化 功能 的 时 候 ， 我 们 在 许多 方法 前 面 
加 上 了 default 关 键 字 做 修饰 。 这 个 default 不 是 全 局 关键 字 ， 而 是 一 个 “上 
下 文 相 关 ” 关 键 字 ， 它 只 在 这 种 场景 下 是 特殊 的 ， 在 其 他 场景 下 ， 我 们 
依然 可 以 用 它 作 为 合法 的 变量 /函数 名 字 。 比 如 标准 库 的 Default trait 中 ， 
就 有 一 个 方法 名 字 叫 作 default () ， 这 并 不 冲突 。 


为 什么 需要 这 样 的 一 个 关键 字 呢 ? 这 是 因为 ， 泛 型 特 化 其 实 很 像 传 
统 OOP 中 的 继承 重 写 override 功 能 。 在 传统 的 支持 重 写 功能 的 语言 中 ， 
一 般 都 有 一 个 类 似 的 标记 : 


(1) C++ 中 使 用 了 virtual 关 键 字 来 让 一 个 万 法司 以 全 于 天 于 中 于 
写 。Modern C++ 还 支持 final 和 override 限 定 符 。 


(2) C# 要 求 使 用 virtual 关 键 字 定义 虚 函 数 ， 用 override 关 键 字 标记 
重 写 方法 。 


(3) Java 默 认 让 所 有 方法 都 是 虚 方 法 ， 但 它 也 支持 用 final 关 键 字 让 
方法 不 可 被 重 写 。 


之 所 以 虚 函 数 需 要 这 样 的 标记 ， 主 要 是 因为 重 写 方法 在 某 种 意义 上 
一 种 非 局 部 交互 。 调 用 虚 函 数 的 时 候 ， 有 可 能 调用 的 是 在 力 外 一 个 子 




















类 中 被 重 写 后 的 版 本 。 在 这 种 情况 下 ， 最 好 是 用 一 种 方式 表示 出 来 ， 这 
个 方法 是 有 可 能 在 其 他 地 方 被 重 写 的 。 


虽然 模板 特 化 跟 虚 函数 重 写 不 是 一 个 东西 ， 但 它们 很 相似 。 所 以 ， 
一 个 可 以 被 特 化 的 方法 ， 最 好 也 用 一 个 明显 的 标签 显 式 标记 出 来 。 这 个 
设计 也 可 以 保证 代码 的 前 向 兼容 性 。 假 如 没有 这 样 的 语法 规定 ， 那 么 很 
可 能 出 现 的 场景 是 :以 前 写 的 一 个 库 明 明 执 行 起 来 没 问 题 ， 现 在 有 了 泛 
型 特 化 之 后 ， 跟 其 他 库 一 起 用 到 一 个 项 目 中 ， 就 有 了 问题 。 比 如 ， 在 某 
个 项 目 中 ， 我 们 针对 一 组 类 型 实现 了 某 个 trait， 而 且 存 在 一 个 变量 调用 
了 这 个 trait 内 部 的 方法 。 但 是 如 果 我 们 引入 一 个 新 的 库 ， 这 个 库 针 对 某 
具体 类 型 实现 了 同样 的 trait， 束 意味 着 存在 了 一 个 更 精确 的 、 更 特 化 的 
实现 ， 于 是 原来 项 目 中 调用 的 方法 束 被 悄 无 声 县 地 改变 了 。 如 果 我 们 规 
定 trait 的 设计 者 本 身 有 权 规 定 上 自己 的 这 个 trait 〈 以 及 trait 内 部 的 每 个 方 
法 ) 是 否 文 持 特 化 ， 束 不 会 出 现 这 个 问题 。 原 有 trait 内 部 的 方法 没有 
default 修 饰 的 话 ， 对 它 进行 特 化 只 会 导致 编译 错误 。 


如 果 没 有 default 修 饰 的 话 ， 会 产生 的 新 间 题 。Rust 里 impl 块 中 的 方 
法 默认 是 不 可 被 * 重 写 " 特 化 的 。 比 如 我 们 已 经 有 一 个 这 样 的 impl 代 码 : 























impl<T> Example for T { 
type Output = Box<T>, 
fn generate(self) -> Box<T> { Box::new(self) } 


} 





此 时 ， 下 面 这 段 调用 应 该 是 可 以 编译 通过 的 : 





fn test(t: bool) -> Box<bool> { 
Example: :generate(t) 





我 们 假设 一 个 针对 bool 类 型 的 特 化 版 本 : 





impl Example for bool 。 

type Output = bool 

fn generate(self) Ss bool { self } 
} 








这 样 就 会 导致 原来 的 test 方 法 编译 失败 ， 因 为 generate 方 法 的 返回 类 


型 变 成 了 bool， 而 不 是 Box<bool>。 如 果 我 们 要 求 使 用 default 关 键 字 来 标 
记 是 否 可 以 被 特 化 的 话 ， 这 个 问题 就 可 以 解决 了 : 





impl<T> Example for T { 

default type Output = Box<T>; 

default fn generate(self) -> Box<T> { Box::new(self) } 
} 


// 编译 器 应 该 会 认为 下 面 的 返回 类 型 不 匹配 

fn test(t: bool) -> Box<bool> { 
Example: :generate(t) 

} 




















编译 器 可 以 制定 一 个 这 样 的 规则 : 如 果 关 联 类 型 前 面 有 default 修 
饰 ， 那 么 调用 generate 方 法 的 返回 值 不 能 直接 当成 Box<T> 类 型 处 理 。 这 
就 可 以 解决 代码 兼容 性 问题 。 


21.7.3 交叉 jmpl 





前 面 我 们 已 经 演示 了 什么 是 泛 型 特 化 。 我 们 可 以 利用 泛 型 针对 一 组 
类 型 写 impl， 还 可 以 继续 针对 这 个 集合 中 的 茶 一 个 部 分 写 更 特殊 的 
impl。 用 集合 的 韦 恩 图 表示 如 右 图 所 示 : 


但 是 ， 如 果 我 们 写 impl 的 时 候 针 对 的 两 个 集合 并 非 真 子 集 关 系 ， 而 
征 交 集 关 系 ， 怎 么 办 ? 就 像 右 图 这 样 : 


用 代码 表示 : 





trait Foo {} 
trait B {} 
trait C {} 


// 第 一 个 ijmpl 
impl<T> Foo for T where T: B 0 
// 第 二 个 impl 
impl<T> Foo for T where T: C {} 


此 时 就 出 现 了 交叉 的 情况 。 万 一 有 一 个 类 型 满足 TI: B+C 呢 ?在 调 
用 Foo 中 的 方法 的 时 候 ， 究 竞选 B 版 本 还 是 选 C 版 本 ? B 和 C 之 间 不 存在 
继承 关系 ,它们 不 是 真 包含 关系 ， 所 以 判断 不 出 究 况 哪个 更 匹配 、 更 特 
殊 、 更 吻合 。 所 以 在 这 种 情况 下 ， 编 译 器 理应 报错 。 


为 了 解决 这 个 问题 ，Rust 设 计 者 又 提出 了 一 个 交集 规则 : 如 果 两 个 
impl 之 间 存 在 交集 ， 而 且 又 不 是 真 包 含 关 系 ， 那 么 可 以 为 这 个 交集 再 写 





一 个 imp1， 这 样 这 个 impl 就 是 最 特 化 的 那个 版 本 。 即 : 





// 第 三 个 impl 
impl<T> Foo for T where T: B+C {} 





如 果 一 个 类 型 既 满 足 B 约 束 ， 又 满足 C 约 束 ， 那 么 与 它 最 匹配 的 impl 
版 本 就 是 新 加 入 的 第 三 个 impl。 


交集 规则 看 起 来 既 简 洁 勾 直观 ， 可 惜 它 并 没有 完全 解决 问题 ， 还 有 


一 个 遗留 问题 一 一 路 项 目 交 互 。 


下 面 有 一 个 比较 复杂 的 例子 ， 来 源 于 Niko 的 博客 。 假 设 我 们 的 项 目 
中 设计 了 一 个 RichDisplay， 它 很 像 标准 库 中 的 Display trait， 但 是 提供 了 
更 多 的 新 功能 。 我 们 会 为 所 有 已 经 实现 了 Display 的 类 型 来 imp] 我 们 的 
RichDisplay: 








// crate 1 

trait RichDisplay {} 

// impl 1 

impl<T> RichDisplay for T where T: Display {} 





现在 假设 在 男 一 个 项 目 widget 里 面 有 个 类 型 Widget<T>。 它 没有 实 
现 Display， 但 是 我 们 希望 为 它 实 现 RichDisplay。 这 没有 什么 问题 ， 因 为 
RichDisplay 是 我 们 上 自己 设计 的 : 





// crate 1 
// impl 2 
impl<T> RichDisplay for Widget<T> where T: RichDisplay {} 








到 这 里 我 们 碰 到 问题 了 : 第 一 个 impl 和 第 二 个 impl 存 在 “潜在 的 ” 交 
又 的 可 能 性 。 第 一 个 impl 是 为 所 有 满足 Display 约 束 的 类 型 实现 
RichDisplay; 第 二 个 impl 是 为 Widget 类 型 实现 RichDisplay。 这 两 个 impl 
针对 的 类 型 集合 是 有 交叉 的 ， 因 此 应 该 出 现 编译 错误 。 


这 里 的 问题 在 于 ，Widget 类 型 是 在 另外 一 个 项 目 中 定义 的 。 虽 然 它 
现在 没有 impl Display， 但 它 存在 这 样 的 可 能 性 。 也 惑 是 说 ，widget 项 目 
加 入 了 以 下 的 代码 ， 也 不 应 该 是 一 个 破坏 性 扩展 : 





// crate widget 
// impl 3 
impl<T> Display for Widget<T> {} 





如 果 这 段 代 码 存在 ， 那 么 前 面 的 第 一 个 impl 和 第 二 个 impl 束 冲突 
了 。 所 以 现在 就 有 一 个 困境 : 上 游 的 widget crate 可 能 在 将 来 加 入 或 者 不 
加 入 这 个 impl， 所 以 目前 第 一 个 impl 和 第 二 个 impl 之 间 的 关系 ， 既 不 能 
被 认为 是 完全 无 和 关 ， 也 不 能 认定 为 泛 型 特 化 。 如 果 设 计 不 当 ， 上 游 项 目 
中 一 个 简单 的 impl 块 ， 有 可 能 引起 下 游 用 户 的 breaking change， 这 是 不 
应 该 出 现 的 。 


所 以 ， 如 果 我 们 要 为 朱 些 trait 添 加 默认 实现 ， 而 且 还 想 继续 保持 代 
人 这 个 问题 就 必须 考虑 。 仅 仅 靠 “真子 集 ? 规 则 是 不 够 
人。 








目前 ， 沁 型 特 化 的 完整 规则 依然 处 于 酝 本 之 中 ， 它 的 功能 短 时 间 内 
还 不 能 稳定 ， 请 大 家 关注 RFC 项 目 中 的 相关 提案 ， 跟 踩 最 新 的 讨论 结 








酒 区 


第 22 章 “” 闭 包 





闭 包 (closure〉 是 一 种 匿名 函数 ， 具 有 “捕获 ”外 部 变量 的 能 力 。 闭 
包 有 了 时候 也 被 称 作 lambda 表 达 式 。 它 有 两 个 特点 : (1) 可 以 像 函 数 一 


I 
法 如 下 : 


fn main() { 
let add = | a :i32, b:i32 | -> i32 { return a+b; } 


let x = add(1,2); 
println!("result is {}", x); 





可 以 看 到 ， 以 上 闭 包 有 两 个 参数 ， 以 两 个 | 包围 。 执 行 语句 包含 在 全 
中 。 财 包 的 参数 和 返回 值 类 型 的 指定 与 普通 函数 的 语法 相同 。 闭 包 的 参 
数 和 返回 值 类 型 都 是 可 以 省 略 的 ， 因 此 以 上 闭 包 可 省 略为 : 


let add = |a ，bl {return a + b;}; 





和 普通 函数 一 样 ， 返 回 值 也 可 以 使 用 语句 块 表达 陈 完成 ， 与 retum 
语句 的 作用 一 样 。 因 此 以 上 闭 包 可 省 略为 : 





let add = |a, b| {a+b}; 


更 进一步 ， 如 果 闭 包 的 语句 体 只 包含 一 条 语句 ， 那 么 外 层 的 大 括号 
也 可 以 省 略 ; 如 果 有 多 条 语句 则 不 能 省 略 。 因 此 以 上 闭 包 可 以 省 略为 : 


let add = |a, bl a + b; 





closure 看 起 来 和 普通 函数 很 相似 ， 但 实际 上 它们 有 许多 区 别 。 最 主 
要 的 区 别 是 ，closure 可 以 “捕获 ”外 部 环境 变量 ， 而 血 不 可 以 。 示 例如 
下 











fn main() { 
let x = 1 i32,; 


fn inner_add() -> i32 { 
义 - 生 沁 
} 


let x2 = inner_add(); 
println!("result is {}", x2); 





编译 ， 出 现 编译 错误 : 





error: can't capture dynamic environment in a fn item; use the || {... } closure fc 





由 此 可 见 ， 函 数 inner_add 是 不 能 访问 变量 x 的 。 那 么 根据 编译 器 的 
提示 ， 我 们 改 为 团 包 试 试 : 





fn main() { 
let x = 1 i32,; 


let inner add = || x+1; 


let x2 = inner_add(); 
println!("result is {}", x2); 





编译 通过 。 


ee 





fn main() { 
let option = Some(2); 
let new: Option<i32> = option.map(multiple2); 
println!("{:?}", New); 


fn multiple2(val: i32) -> i32{ val*2 } 





在 上 面 示 例 中 ，map 方 法 的 签名 是 : 





fn map<U, F>(self, f: F) -> Option<U> 
where F: Fnonce(T) -> U 


这 里 的 FnOnce 在 下 文中 会 详细 解释 。 它 在 此 处 的 含义 是 : f 是 一 个 
闭 包 参数 ， 类 型 为 FnOnce(T) ->U， 根 据 上 下 文 类 型 推导 ， 实 际 上 是 
FnOnce (i32) ->i32。 我 们 定义 了 一 个 普通 函数 ， 类 型 为 fn (i32) - 
3 
以 : 





Jet new: Option<i32> = option.map(|val| val * 2); 





普通 函数 和 闭 包 之 间 最 大 的 区 别 是 ， 普 通 函 数 不 可 以 捕获 环境 变 
量 。 在 上 面 的 例子 中 ， 虽 然 我 们 的 multiple2 函 数 定 义 在 main 函 数 体 内 ， 
但 是 它 无 权 访问 main 函 数 内 的 局 部 变量 。 其 次 ， 包 定义 和 调用 的 位 置 并 
不 重要 ，Rust 中 是 不 需要 前 向 声明 的 。 只 要 函数 定义 在 当前 范围 内 是 可 
以 观察 到 的 ， 就 可 以 直接 调用 ， 不 管 在 源码 内 的 相对 位 置 如 何 。 相 对 而 
言 ，closure 更 像 是 一 个 的 变量 ， 它 具有 和 变量 同样 的 “生命 周期 ” 











22.1 变量 捕获 


接 下 来 我 们 研究 一 下 closure 的 原理 。Rnust 目 前 的 closure 实 现 ， 又 叫 
作 unboxed closure， 它 的 原理 与 C++11 的 lambda 非 常 相 似 。 当 一 个 
closure 创 建 的 时 候 ， 编 译 峰 帮 有 我 们 生成 了 一 个 匿名 struct 类 型 ， 通 过 目 动 
分 析 closure 的 内 部 逻辑 ， 来 决定 该 结构 体 包括 哪些 数据 ， 以 及 这 些 数据 
该 如 何 初 始 化 。 


考虑 以 下 例子 : 





fn main() { 
let x=1 工 32 
let add x= |a|x+a; 
let result = add x( 5 ); 
println!i("result is {}", result); 
} 





a 我 们 来 思考 一 下 :如 宋 不 使 用 财 包 来 实现 以 上 逻辑 ， 该 怎么 做 ? 方 
法 如 下 : 





struct Closure { 
Inner1: i32 
} 


impl Closure { 
fn call(&self, a: i32) -> i32 { 
Self,inner1 + a 
} 
} 


fn main() { 
let x = 1 i32,; 
let add x = Closure{ inner1: x}; 
let result = add x.call(5); 
println!i("result is {}", result); 
} 





上 面 这 个 例子 ， 我 们 模拟 了 一 个 财 包 的 原理 ， 实 际 上 Rnust 编 译 器 就 
是 用 类 似 的 手法 来 处 理 闭 包 语法 的 。 对 比 一 下 使 用 财 包 语法 的 版 本 和 手 
2 我 们 可 以 看 到 ， 创 建 闭 包 的 时 候 ， 束 相当 于 创建 了 一 个 
结构 体 ， 我 们 把 需要 捕获 的 环境 变量 存 到 这 个 结构 体 中 。 闭 包 调 用 的 时 
候 ， 相 当 于 调用 了 跟 这 个 结构 体 相关 的 一 个 成 员 函 数 。 





但 是 ， 还 有 几 个 问题 没有 解决 。 当 编译 器 把 闭 包 语 法 糖 转换 为 普通 
的 类 型 和 函数 调用 的 时 候 : 


(1) 结构 体内 部 的 成 员 应 该 用 什么 类 型 ， 如 何 初 始 化 ?应 该 用 i32 
或 是 &i32 还 是 &mut i32? 


(2) 函数 调用 的 时 候 self 应 该 用 什么 类 型 ? 应 该 写 self 或 是 &self 还 
是 &mut self? 


理解 了 这 两 个 问题 的 答案 ， 束 能 完全 理解 了 Rust 的 闭 包 的 原理 。 


关于 第 一 个 问题 ，Rust 主 要 是 通过 分 析 外 部 变量 在 闭 包 中 的 使 用 方 
式 ， 通 过 一 系列 的 规则 目 动 推导 出 来 的 。 主 要 规则 如 下 : 


(1) 如 果 一 个 外 部 变量 在 闭 包 中 ， 只 通过 借用 指针 & 使 用 ， 那 么 
这 个 变量 就 可 通过 引用 && 的 方式 捕获 ; 


(2) 如 果 一 个 外 部 变量 在 闭 包 中 ， 通 过 &mut 指 针 使 用 过 ， 那 么 这 
个 变量 就 需要 使 用 &mnut 的 方式 捕获 ; 


(3) 如果 一 个 外 部 变量 在 财 包 中 ， 通 过 所 有 权 转 移 的 方式 使 用 
过 ， 那 么 这 个 变量 就 需要 使 用 "by value”self 的 方式 捕获 。 


简单 点 总 结 规则 是 ， 在 保证 能 编 诺 通过 的 情况 下 ， 编 诺 侣 会 目 动 选 
择 一 种 对 外 部 影响 最 小 的 类 型 存储 。 对 于 被 捕获 的 类 型 为 T 的 外 部 变 
量 ， 在 匿名 结构 体 中 的 存储 方式 选择 为 : 尽 可 能 先 选择 &T 类 型 ， 其 次 
选择 &mut T 类 型 ， 最 后 选择 T 类 型 。 示 例如 下 : 


























struct T(i32); 


fn by_value(_: T) 全 
fn by_mut(_: &mut T) {} 
fn by_ref(_: &T) {} 


fn main() { 
let x: T = T(1); 
let y: T = T(2); 
let mut z: T = T(3); 


let closure = || { 
by_value(x); 
by_ref(&y); 
by_mut(&mut z); 
}; 


Closure()， 








以 上 闭 包 捕获 了 外 部 的 三 个 变量 xyz。 其 中 ，y 通 过 &T 的 方式 被 使 
用 了 ; z 通 过 &mut T 的 方式 被 使 用 了 ; x 通过 T 的 方式 被 使 用 了 。 编 译 嚣 
会 根据 这 些 信息 ， 目 动 生成 结构 类 似 下 面 这 样 的 匿名 结构 体 : 








// 实际 类 型 名 字 是 编译 器 按 某 些 规则 自动 生成 的 
struct ClosureEnvironment<'y, 'z> { 
> 
y: &'yT, 
z: &'z mut T， 
} 











而 原 示例 中 的 dlosure 这 个 局 部 变量 ， 就 是 这 个 类 型 的 实例 。 对 我 们 
来 说 ， 这 个 类 型 是 匿名 的 。 


22.2 ”move 天 键 字 


以 上 变量 捕获 的 规则 都 是 针对 只 作为 局 部 变量 的 财 包 而 准备 的 。 有 
些 时 候 ， 我 们 的 财 包 的 生命 周期 可 能 会 超过 一 个 函数 的 范围 。 比 如 ， 我 
们 可 以 将 此 财 包 存储 到 共 个 数据 结构 中 ， 在 当前 函数 返回 之 后 继续 使 
用 。 这 样 一 来 ， 就 可 能 出 现 更 复杂 的 情况 : 在 财 包 被 创建 的 时 候 ， 它 通 
过 引用 的 方式 捕获 了 某 些 局 部 变量 ， 而 在 财 包 被 调用 的 时 候 ， 它 所 指 回 
的 一 些 外 部 变量 已 经 被 释放 了 。 示 例如 下 : 























fn make_adder(x: i32) -> Box<Fn(I32) -> i32> { 
Box::new(|y| x + y) 


fn main() { 
let f = make_adder(3); 


printin!1("{}", f(1)); // 4 
printin!("{}", f(10)); // 13 





大 家 可 以 看 到 ， 函 数 make_adder 中 有 一 个 局 部 变量 x， 按 照 前 面 所 
述 的 规则 ， 它 被 团 包 所 捕获 ， 而 且 可 以 使 用 引用 & 的 方式 完成 闭 包 内 部 
的 逻辑 ， 因 此 它 是 被 引用 捕获 的 。 而 闭 包 则 作为 函数 返回 值 被 传递 出 去 
了 。 于 是 ， 闭 包 被 调用 的 时 候 ， 它 让 部 的 引用 所 指向 的 向 容 已 经 铲 释放 
了 。 这 种 情况 ， 应 该 会 出 现 典 型 的 野 指 针 问 题 ， 属 于 内 存 不 安全 的 范 
畴 。 和 幸运 的 是 ， 该 程序 在 Rust 中 根本 无 法 编译 通 前 过 ， 错 误 信 息 为 : 














error: closure may outlive the current function, but it borrows ‘x', which is owned 








信息 提示 得 非常 清晰 ， 我 们 又 可 以 感谢 Rust 帮 我 们 发 现 了 一 个 问 
题 。 





那么 这 种 情况 ， 我 们 应 该 怎样 写 才 对 呢 ? 这 里 要 介绍 一 个 新 的 关键 
字 move， 它 的 功能 是 用 于 修饰 一 个 闭 包 。 示 例如 下 : 





fn make_adder(x: i32) -> Box<Fn(I32) -> i32> { 
Box: a Iy| x + y) 
// 注意 这 里 
































加 上 move 关 键 字 之 后 ， 所 有 的 变量 捕获 全 部 使 用 by value 的 方式 。 
也 束 是 说 ， 编 译 占 生成 的 匿名 结构 体内 部 看 起 来 像 是 下 面 这 样 : 











struct ClosureEnvironment { 
x: TYPE1, // 
y: TYPE2， // 这 里 没有 &TYPE, &mut TYPE, 所 有 被 捕获 的 外 部 变量 所 有 权 一 律 转移 进 闭 包 
z: TYPE3, // 

} 

































































所 以 ，move 关 键 字 可 以 改变 闭 包 捕获 变量 的 方式 ， 一 般 用 于 闭 包 
需要 传递 到 函数 外 部 〈escaping closure) 的 情况 。 


22.3 Fn/FnMut/FnOnce 


外 部 变量 捕获 的 问题 解决 了 ， 我 们 再 看 看 第 二 个 问题 ， 闭 包 被 调用 
的 方式 。 我 们 注意 到 ， 闭 包 被 调用 的 时 候 ， 不 需要 执行 某 个 成 员 函 数 ， 
而 是 采用 类 似 函 数 调 用 的 语法 来 执行 。 这 是 因为 它 上 自动 实现 了 编译 占 提 
供 的 几 个 特殊 的 trait，Fn 或 者 FnMut 或 者 FnOnce。 


注意 : 小 写 甸 是 关键 字 ， 用 于 声明 函数 ;大写 的 Fn 不 是 关键 字 ， 只 
征 定义 在 标准 库 中 的 一 个 trait。 


它们 的 定义 如 下 : 











pub trait Fnonce<Args> { 
type Output,; 
extern "rust-call" fn call once(self, args: Args) -> Self::0Output,; 


} 
pub trait FnMut<Args> : FnOonce<Args> { 

extern "rust-call" fn call mut(&mut self, args: Args) -> Self::0Output; 
} 


pub trait Fn<Args> : FnMut<Args> { 
extern "rust-call" fn call(&self, args: Args) -> Self::Output; 
} 





这 几 个 trait 的 主要 区 别 在 于 ， 被 调用 的 时 候 self 参 数 的 类 型 。 
FnOnce 被 调用 的 时 候 ，self 是 通过 move 的 方式 传递 的 ， 因 此 它 被 调用 之 
后 ， 这 个 闭 包 的 生命 周期 就 已 经 结束 了 ， 它 只 能 被 调用 一 次 ; FnMut 被 
调用 的 时 候 ，self 是 &mut Self 类 型 ， 有 能 力 修改 当前 闭 包 本 里 的 成 员 ， 
甚至 可 能 通过 成 员 中 的 引用 ， 修 改 外 部 的 环境 变量 ，Fn 被 调用 的 时 候 ， 
self 是 &Self 类 型 ， 只 有 读 取 环 境 变 量 的 能 力 。 


目前 这 几 个 trait 还 处 于 unstable 状 态 。 在 目前 的 稳定 版 编译 器 中 ， 我 
们 不 能 针对 自 定义 的 类 型 实现 这 几 个 trait， 只 能 在 nightly 版 本 中 开启 #! 
[feature (fn traits) ] 功 能 。 


那么 ， 对 于 一 个 闭 包 ， 编 译 器 是 如 何 选择 impl 哪 个 trait 呢 ?答案 
是 ， 编 译 器 会 都 尝试 一 遍 ， 实 现 能 让 程序 编译 通过 的 那 几 个 。 闭 包 调 用 
的 时 候 ， 会 尽 可 能 先 选择 调用 fn call (&self，args: Args) 函数 ， 其 次 





尝试 选择 fn call_mut (&self，args: Args) 函数 ， 最 后 尝试 使 用 fn 
call_once (self，args: Args) 函数 。 这 些 都 是 编译 器 自动 分 析出 来 的 。 


还 是 用 示例 来 讲解 比较 清晰 : 








fn main() { 
Jet v: Vec<i32> = vec![]; 
let c = || std::mem::drop(v); 
c(); 

} 





对 于 上 例 ，drop 函 数 的 签名 是 外 drop<T> (_x: T) ， 它 接受 的 参数 
类 型 是 T。 因 此 ， 在 闭 包 中 使 用 该 函数 会 导致 外 部 变量 v 通 过 move 的 方 
式 被 捕获 。 编 译 需 为 该 朵 包 目 动 生成 的 匿名 类 型 ， 类 似 下 面 这 样 : 








Struct ClosureEnvironment { 
VvV: Vec<i32> // 这 里 不 是 引用 
} 
































对 于 这 样 的 结构 体 ， 我 们 来 尝试 实现 FnMut trait: 





impl FnMut<Vec<i32>> for ClosureEnvironment { 
extern "rust-call" fn call mut(&mut self, args: Args) -> Self::Output { 
drop(self.v) 





当然 ， 这 是 行 不 通 的 ， 因 为 函数 体内 需要 一 个 Self 类 型 ， 但 是 函数 
参数 只 提供 了 &mut Self 类 型 。 因 此 ， 编 译 器 不 会 为 这 个 闭 包 实现 FnMut 
trait。 唯 一 能 实现 的 trait 就 只 剩 下 了 FnOnce。 


这 个 财 包 被 调用 的 时 候 ， 当 然 就 会 调用 call_once 方 法 。 我 们 知道 ， 
fn call_ once (self，arg: Args) 这 个 函数 被 调用 的 时 候 ，self 参 数 是 
move 进 入 函数 体 的 ， 会 “ 吃 抒 ?self 变量 。 在 此 函数 调用 后 ， 这 个 财 包 的 
生命 周期 就 结束 了 。 所 以 ，FnOnce 类 型 的 闭 包 只 能 被 调用 一 次 。 
FnOnce 也 是 得 名 于 此 。 我 们 自己 来 试 一 下 : 





fn main() { 


Jet v: Vec<i32> = vec![]; 


























let c = || drop(Vv); // 闭 包 使 用 捕获 变量 的 方式 ,决定 了 这 个 财 包 的 类 型 。 它 只 实现 了 `Fnonce tri 
c(); 


c(); // 再 调用 一 次 试 试 ,编译 错误 use of moved value: `c`。C 是 怎么 被 nove 走 的 ? 












































} 





编译 器 在 处 理 上 面 这 段 代码 的 时 候 ， 做 了 一 个 下 面 这 样 的 展开 : 





fn main() { 
struct ClosureEnvironment { 
_V: Vec<i32> 


let v: Vec<i32> = vec![]; 

let c = ClosureEnvironment { _v: V }; // v move 进入 了 c 的 成 员 中 
c.call _once(); // c move 进入 了 call_once 方法 中 
c,call_once(); // c 的 生命 周期 已 经 结束 了 , 这 里 的 调用 会 发 生 编译 错误 





















































同样 的 道理 ， 我 们 试 试 Fn 的 情况 : 





fn main() { 
let v: Vec<i32> = vec![1,2,3]; 
let c= || for i in &v { println!("{}", i); }; 
c(); 
c(); 





可 以 看 到 ， 上 面 这 个 财 包 捕获 的 环境 变量 在 使 用 的 时 候 ， 只 需要 
&Vec<i32> 类 型 即 可 ， 因 此 它 只 需要 捕获 环境 变量 v 的 引用 。 因 此 它 能 
实现 Fn trait。 闭 包 在 被 调用 的 时 候 ， 执 行 的 是 fn call (C&self) 函数 ， 所 
以 ， 调 用 多 次 也 是 没 问 题 的 。 


我 们 如 果 给 上 面 的 程序 添加 move 关 键 字 ， 依 然 可 以 通过 : 











fn main() { 
let v: Vec<i32> = vec![1,2,3]; 
let c = move || for i in &v { printiln!("{}", i); }; 
c(); 
c(); 





可 以 看 到 ，move 关 键 字 只 是 影响 了 环境 变量 被 捕获 的 方式 。 第 三 
行 ， 创 建 闭 包 的 时 候 ， 变 量 v 被 move 进 入 了 闭 包 中 ， 闭 包 中 捕获 变量 包 
括 了 一 个 拥有 所 有 权 的 Vec<i32>。 第 四 行 ， 闭 包 调 用 的 时 候 ， 根 据 推断 


规则 ， 它 依然 是 Fn 型 的 财 包 ， 使 用 的 是 fn call (&self) 函数 ， 因 此 团 包 
变量 c 可 以 被 多 次 调用 。 


22.4 团 包 与 泛 型 








我 们 已 经 知道 ， 闭 包 是 依靠 trait 来 实现 的 。 跟 普通 trait 一 样 ， 我 们 
不 能 直接 用 Fn FnMut FnOnce 作 为 变量 类 型 、 函 数 参 数 、 函 数 返 回 值 。 


跟 其 他 的 trait 相 比 ， 闭 包 相 关 的 trait 语 法 上 有 特殊 之 处 。 比 如 ， 如 
果 我 们 想 让 闭 包 作为 一 个 参数 传递 到 函数 中 ， 可 以 这 样 写 : 





fn call with closure<F>(some_closure: F) -> i32 
where F : Fn(i32) -> i32 { 
some_closure(1) 


} 


fn main() { 
let answer = call with closure(|x| x + 2); 
println!("{}", answer); 


} 





其 中 泛 型 参数 F 的 约束 条 件 是 F: Fn (i32) ->i32。 这 里 Fn (i32) - 
>i32 是 针对 闭 包 设计 的 专门 的 语法 ， 而 不 是 像 普 通 trait 那 样 使 用 
Fn<i32，i32> 来 写 。 这 样 设计 为 了 让 它们 看 起 来 跟 普 通 函 数 类 型 
fn (i32〉->i32 更 相似 。 除 了 语法 之 外 ，Fn FnMut FnOnce 其 他 方面 都 跟 
普通 的 泛 型 一 致 。 


一 定 要 注意 的 是 : 每 个 朵 包 ， 编 译 需 都 会 为 它 生 成 一 个 匿名 结构 体 
类 型 ， 即 使 两 个 财 包 的 参数 和 返回 值 一 致 ， 它 们 也 是 完全 不 同 的 两 个 类 
型 ， 只 是 都 实现 了 同一 个 trait 而 已 。 下 面 我 们 用 一 个 示例 演示 : 





fn main() { 

// 同一 个 变量 绑 定 了 两 次 
let mut closure = |x : i32| -> i32 {x+2}; 
closure = |x: i32| -> i32 {x-23};， 
println!("{}", closure()); 








} 





编译 ， 结 果 出 错 ， 错 误 信 息 为 : 





error: mismatched types: 
expected “ [closure@temp.rs:3:21: 3:47] ， 
found “ [closureQ@temp ,rs:4:13: 4:38]. 


(expected closure, 
found a different closure) [E0308] 





可 以 看 到 ， 我 们 用 同一 个 变量 来 绑 定 两 个 财 包 的 时 候 发 生 了 类 型 错 
误 。 请 大 家 牢 牢 记 住 ， 不 同 的 闭 包 是 不 同 的 类 型 。 


既然 如 此 ， 跟 普通 的 trait 一 样 ， 如 果 我 们 需要 问 函 数 中 传递 闭 包 ， 
有 下 面 两 种 方式 。 


通过 泛 型 的 方式 。 这 种 方式 会 为 不 同 的 闭 包 参 数 类 型 生成 不 同 版 
本 的 函数 ， 实 现 静 态 分 派 。 


通过 trait object 的 方式 。 这 种 方式 会 将 财 包装 箱 进入 扒 内存 中 ， 同 
函数 传递 一 个 胖 指针 ， 实 现 运行 期 动态 分 派 。 


关于 动态 分 派 和 静态 分 小 的 内 容 ， 将 在 下 一 章 中 详细 说 明 。 此 处 只 
做 一 个 简单 示例 : 















































fn static_dispatch<F>(closure: &F) // 这 里 是 泛 型 参数 。 对 于 每 个 不 同类 型 的 参数 , 编译 器 将 会 生成 
where F: Fn(i32) -> i32 








println!("static dispatch {}", closure(42)); 


fn dynamic_dispatch(closure: &Fn(i32)->i32) // 这 里 是 `trait object  `Box<Fn(i32)->i3: 


println!("dynamic dispatch {}", closure(42)); 


fn main() { 
let closure1 = | | 
let closure2 = | 
fn function_ptr(x: i32)->i32 { xXx*4}; 


static_ dispatch(&closure1); 
static_ dispatch(&closure2); 
static_dispatch(&function_ptr); // 普通 `fn 函数 也 实现 了 `Fn trait `， 它 可 以 与 此 参数 类 型 下 




















dynamic_dispatch(&closurel1); 
dynamic_dispatch(&closure2); 
dynamic_dispatch(&function_ptr); 





如 果 我 们 希望 一 个 财 包 作 为 函数 的 返回 值 ， 那 么 就 不 能 使 用 泛 型 的 
方式 了 。 因 为 如 果 泛 型 类 型 不 在 参数 中 出 现 ， 而 仅 在 返回 类 型 中 出 现 的 
话 ， 会 要 求 在 调用 的 时 候 显 式 指 定 类 型 ， 编 译 融 才能 完成 类 型 推导 。 可 


是 调用 方 根本 无 法 指定 具体 类 型 ， 因 为 闭 包 类 型 是 匿名 类 型 ， 用 户 无 法 
显 式 指定 。 所 以 下 面 这 样 的 写法 是 编译 不 过 的 : 











fn test<F>() -> F 
where F: Fn(i32)->i32 


return | i |i* 2; 


} 


fn main() { 
let closure = test(); 


} 





修复 这 段 代 码 有 两 种 方案 ， 一 种 是 静态 分 派 ， 一 种 是 动态 分 派 。 


:静态 分 派 。 我 们 可 以 用 一 种 新 的 语法 fn test () ->impl Fn (i32) - 
>i32 来 实现 。 在 后 面 的 章节 中 有 这 个 语法 糖 的 详细 介绍 。 


:动态 分 派 。 束 是 把 闭 包 浅 箱 进 入 堆 内 存 中 ， 使 用 Box<dyn 
Fn 〈i32) ->i32> 这 种 trait object 类 型 返回 。 关 于 trait object 的 内 容 可 参见 
us 








fn test() -> Box<dyn Fn(i32)->i32 > 
{ 


let c= | i: i32 | i* 2,; 
Box: :new(c) 


} 


fn main() { 
let closure = test(); 
let r = closure(2); 
println!("{}", r); 


ee | 


22.5” 闭 包 与 生命 周期 


当 使 用 闭 包 做 参数 或 返回 值 的 时 候 ， 生 命 周 期 会 变 得 更 加 复杂 。 假 
设 有 下 面 这 段 代 码 : 





fn calc_by<'a, F>(var: &'a i32, f: F) -> i32 
where F: Fn(&'a i32) -> i32 


f(var) 


fn main() { 
let local = 10; 
let result = calc_ by(&local, |i| i*2),; 
println!i("{}", result); 





这 段 代 码 可 以 编译 通过 。 但 是 ， 假 如 我 们 把 calc_by 的 函数 体 和 微 改 
一 下 ， 变 成 下 面 这 样 : 








Jet local = *Var 
f(&local) 





就 不 能 编译 通过 了 。 
但 是 ， 如 宋 我 们 把 所 有 的 生命 周期 标记 去 掉 ， 变 成 这 样 : 





fn calc_by<F>(var: &i32, f: F) -> i32 
where F: Fn(&i32) -> i32 


let local = *Var ， 
f(&local) 


fn main() { 
let local = 10; 
let result = calc by(&local, |i| i*2); 
println!("{}", result); 





它 就 又 可 以 编译 通过 了 。 这 说 明 ， 我 们 前 面 对 这 个 calc_by 函 数 手 写 
的 生命 周期 标记 有 问题 。 





对 于 上 面 这 个 例子 ， 所 有 的 借用 生命 周期 都 是 由 编译 器 目 动 补 全 
的 ， 假 如 我 们 手动 来 补 全 这 些 标记 ， 应 该 怎么 做 呢 ? 


在 这 里 我 们 只 能 使 用 “高 阶 生命 周期 ”的 表示 方法 : 








fn calc_by<'a, F>(var: &'a i32, f: F) -> i32 
where F: for<'f> Fn(&'f i32) -> i32 


Jet local = *var; 
f(&local) 
} 








注意 F 的 约束 条 件 ， 这 样 写 表 示 的 意思 是 ，Fn 的 输入 参数 可 作用 于 
任意 的 生命 周期 f， 这 个 生命 周期 和 男 外 一 个 参数 var 的 生命 周期 没有 半 
扩 关 系 。 


这 才 是 这 段 代 码 正确 的 生命 周期 标记 方式 。 如 果 我 们 不 手动 标记 出 
来 ， 编 译 器 为 我 们 目 动 推导 的 生命 周期 关系 束 是 这 样 的 高 阶 生 命 周 期 。 


谈 到 “高 阶 " 这 两 个 字 ， 很 多 朋友 会 想到 高 阶 类 型 (higher kinded 
types) 。 这 里 的 高 阶 生 命 周 期 确实 跟 高 阶 类 型 有 很 多 相似 之 处 ，Rnust 也 
确实 在 思考 如 何 引 入 高 阶 类 型 这 个 问题 ， 但 还 没有 做 出 最 终 决 是。 到 目 
前 为 止 ，for<'a>Fn(&'a Arg) ->&'a Ret 这 样 的 语法 ， 只 能 用 于 生命 周期 
参数 ， 不 能 用 于 任意 泛 型 类 型 。 


第 23 章 ”动态 分 派 和 静态 分 派 


Rust 可 以 同时 支持 “静态 分 派 ”(static dispatch ) 和 “动态 分 
派 ”(dynamic dispatch) 。 


所 谓 “ 静 态 分 派 ?， 和 是 指 具体 调用 哪个 函数 ， 在 编译 阶段 束 确 定 下 来 
了 。Rust 中 的 “静态 分 派 ? 靠 这 型 以 及 impl trait 来 完成 。 对 于 不 同 的 泛 型 
类 型 参数 ， 纺 译 器 会 生成 不 同 版 本 的 函数 ， 在 编译 阶段 就 确定 好 了 应 该 
调用 哪个 函数 。 


所 谓 “ 动 态 分 派 ”， 是 指 具 体 调用 哪个 函数 ， 在 执行 阶段 才能 确定 。 
Rust 中 的 “动态 分 派 * 靠 Trait Object 来 完成 。Trait Object 本 质 上 是 指针 ， 
它 可 以 指 癌 不 同 的 类 型 ， 指 问 的 具体 类 型 不 同 ， 调 用 的 方法 也 就 不 同 。 


我 们 用 一 个 示例 来 说 明 。 假 设 我 们 有 一 个 trait Bird， 有 男 外 两 个 类 
型 都 实现 了 这 个 trait， 我 们 要 设计 一 个 函数 ， 既 可 以 接受 Duck 作 为 参 
数 ， 也 可 以 接受 Swan 作 为 参数 。 





trait Bird { 
fn fly(&self); 
} 


struct Duck; 
struct Swan,; 
impl Bird for Duck 


fn fly(&self) { println!("duck duck"); } 
} 


impl Bird for Swan 
fn fly(&self) { println!("swan swan");} 








首先 ， 大 家 需要 牢 牢 记 住 的 一 件 事情 是 ，trait 是 一 种 DST 类 型 ， 它 
2 这 意味 着 下 和 面 这 样 的 代码 是 无 法 编译 通 
过 的 : 





fn test(arg: Bird) 人 
fn test() -> Bird 全 





因为 Bird 是 一 个 trait， 而 不 是 具体 类 型 ， 它 的 size 无 法 在 编译 阶段 确 
定 ， 所 以 编译 器 是 不 允许 直接 使 用 trait 作 为 参数 类 型 和 返回 类 型 的 。 这 
也 是 trait 跟 许多 语言 中 的 “interface” 的 一 个 区 别 。 


这 种 时 候 我 们 有 两 种 选择 。 一 种 是 利用 泛 型 : 





fn test<T: Bird>(arg: T) { 
arg.fly(); 
} 





这 样 ，test 函 数 的 参数 既 可 以 是 Duck 类 型 ， 也 可 以 是 Swan 类 型 。 实 
际 上 ， 编 译 器 会 根据 实际 调用 参数 的 类 型 不 同 ， 直 接生 成 不 同 的 函数 版 
本 ， 类 似 C++ 中 的 template: 





// 伪 代 码 示意 
fn test_Duck(arg: Duck) { 
arg.fly(); 


fn test_Swan(arg: Swan) { 
arg.fly(); 








所 以 ， 通 过 泛 型 函数 实现 的 “多 态 ”， 是 在 编译 阶段 就 已 经 确定 好 了 
调用 哪个 版 本 的 函数 ， 因 此 被 称 为 "静态 分 派 ”。 除 了 泛 型 之 外 ，Rnusti 在 
提供 了 一 种 impl Trait 语 法 ， 也 能 实现 脐 态 分 派 。 


我 们 还 有 男 外 一 种 办 法 来 实现 “多 态 ”， 那 就 是 通过 指针 。 虽 然 trait 
是 DST 类 型 ， 但 是 指 疝 trait 的 指针 不 是 DST。 如 果 我 们 把 trait 隐 藏 到 指针 
的 后 面 ， 那 它 就 是 一 个 trait object， 而 它 是 可 以 作为 参数 和 返回 类 型 
的 。 

















// 根据 不 同 需求 , 可 以 用 不 同 的 指针 类 型 ,如 Box/&/&mut 等 
fn test(arg: Box<dyn Bird>) { 
arg.fly(); 








在 这 种 方式 下 ，test 疯 数 的 参数 既 可 以 是 Box<Duck> 类 型 ， 也 可 以 
是 Box<Swan> 类 型 ， 一 样 实现 了 “多 态 ”。 但 在 参数 类 型 这 里 已 经 将 “ 具 
体 类 型 * 信 息 抹 挤 了 ， 我 们 只 知道 它 可 以 调用 Bird trait 的 方法 。 而 具体 调 





用 的 是 哪个 版 本 的 方法 ， 实 际 上 是 由 这 个 指针 的 值 来 决定 的 。 这 就 


是 “动态 分 派 ”。 


23.1 trait object 


什么 是 trait object 呢 ?指向 trait 的 指针 就 是 trait object。 假 如 Bird 是 一 
个 trait 的 名 称 ， 那 么 dyn Bird 就 是 一 个 DST 动 态 大 小 类 型 。&dyn Bird、 
&mut dyn Bird、Box<dyn Bird>、*const dyn Bird、*mut dyn Bird 以 及 
Rc<dyn Bird> 等 等 都 是 Trait Object。 


9 注意 ”dyn 是 一 个 新 引入 的 上 下 文 关键 字 (Contextual 
keyword) ， 目 前 还 没有 稳定 。 用 户 需 要 手动 打开 #! 
[feature (dyn_trait) ] 才 能 使 用 。 目 前 的 trait object 默 认 的 语法 是 没有 dyn 
关键 字 的 。 


trait object 这 个 名 字 以 后 也 会 被 改 为 dynamic trait type。impl Trait for 
Trait 这 样 的 语法 同样 会 被 改 为 impl Trait for dyn Trait。 这 样 能 更 好 地 跟 
impl Trait 语 法 对 应 起 来 。 


当 指 针 指 网 trait 的 时 候 ， 这 个 指针 就 不 是 一 个 普通 的 指针 了 ， 变 成 
一 个 “ 胖 指 针 ”。 请 大 家 回忆 一 下 前 文 所 讲解 的 DST 类 型 : 数组 类 型 [T] 是 
一 个 DST 类 型 ， 因 为 它 的 大 小 在 编译 阶段 是 不 确定 的 ， 相 对 应 的 ，&[ 了 T] 
类 型 就 是 一 个 “ 胖 指 针 ”， 它 不 仅 包 含 了 指针 指向 数组 的 其 中 一 个 元 素 ， 
同时 包含 一 个 长 度 信息 。 它 的 内 部 表示 实质 上 有 是 Slice 类 型 。 


同 理 ，Bird 只 是 一 个 trait 的 名 字 ， 符 合 这 个 trait 的 具体 类 型 可 能 有 多 
种 ， 这 些 类 型 并 不 有 具备 同样 的 大 小 ， 因 此 使 用 dyn Bird 来 表示 满足 Bird 
约束 的 DST 类 型 。 指 向 DST 的 指针 理所当然 也 应 该 是 一 个 “ 胖 指 针 ”， 它 
的 名 字 就 叫 trait object。 比 如 Box<dyn Bird>， 它 的 内 部 表示 可 以 理解 成 
下 面 这 样 : 














pub struct TraitObject { 
pub data: *mut (), 
pub vtable: *mut (), 
} 








它 里 面包 含 了 两 个 成 员 ， 都 是 指向 单元 类 型 的 裸 指针 。 在 这 里 声明 
的 指针 指向 的 类 型 并 不 重要 ， 我 们 只 需 知 道 它 里 面包 含 了 两 个 裸 指针 即 
可 。 由 上 可 见 ， 和 Slice 一 样 ，Trait Object 除 了 包含 一 个 指针 之 外 ， 还 带 





有 另外 一 个 “元 数据 "， 它 了 驶 是 指向 “ 虚 函 数 表 ”的 指针 。 这 里 用 的 是 裸 指 

针 ， 指 向 unit 类 型 的 指针 *mut() 实际 上 类 似 于 C 语 言 中 的 void*。 我 们 

9 如 果 把 它 里 面 的 数值 当成 整数 拿 出 来 会 是 
和 弛 森 : 








#![feature(dyn_trait)] 
use std::mem; 
trait Bird { 
fn fly(&self); 
struct Duck; 
struct Swan; 
impJ Bird for Duck { 
fn fly(&self) { println!("duck duck"); } 


impl Bird for Swan { 
fn fly(&self) { println!("swan swan");} 





} 
// 参数 是 trait object 类 型 ,p 是 一 个 胖 指针 
fn print_traitobject(p: &dyn Bird) { 














// 使 用 transmute 执 行 强制 类 型 转换 , 把 变量 p 的 内 部 数据 取出 来 
let (data, vtable) : (usize, * const usize) = unsafe {mem::transmute(p)}; 
println!("TraitObject [data:{}, vtable:{:p}]", data, vtable); 
unsafe { 
// 打印 出 指针 v 指向 的 内 存 区 间 的 值 
println!("data in vtable [€}, €}, OQ, Ol", 
*vtable, *vtable.offset(1), *vtable.offset(2), *vtable.offset(3)); 











} 


fn main() { 
let duck = Duck; 
let p_duck = &duck; 
let p_bird = p_duck as &dyn Bird; 
println!("Size of p_duck {}, Size of p_bird {}", mem::size of val(&p_duck), mem: 


let duck_fly : usize = Duck::fly as usize; 
let swan_fly : usize = Swan::fly as usize; 
println!("Duck::fly {}", duck_fly); 
println!("Swan::fly {}", swan_fly); 


print_traitobject(p_bird); 
let swan = Swan; 
print_traitobject(&swan as &dyn Bird); 





执行 结果 为 : 





Size of p_duck 8, Size of p_bird 16 

Duck: :fly 139997348684016 

Swan: :fly 139997348684320 

TraitObject [data:140733800916056, vtable:139997351089872] 
data in vtable [139997348687008, 0, 1, 139997348684016] 
TraitObject [data:140733800915512, vtable:139997351089952] 
data in vtable [139997348687008, 0, 1, 139997348684320] 





我 们 可 以 看 到 ， 下 接 针 对 对 象 取 指针 ， 得 到 的 是 普通 指针 ， 它 占据 
64 bit 的 空间 。 如 果 我 们 把 这 个 指针 使 用 as 运 算 符 转换 为 trait object， 它 
就 成 了 胖 指 针 ， 携 带 了 额外 的 信息 。 这 个 额外 信息 很 重要 ， 因 为 我 们 还 
需要 使 用 这 个 指针 调用 函数 。 如 果 指 癌 trait 的 指针 只 包含 了 对 象 的 地 
址 ， 那 么 它 就 没 办 法 实现 针对 不 同 的 具体 类 型 调用 不 同 的 函数 了 。 所 
以 ， 它 不 仅 要 包含 一 个 指 回 真 实 对 象 的 指针 ， 还 要 有 一 个 指 回 所 谓 
的 “ 虚 函 数 表 ” 的 指针 。 我 们 把 虚 函 数 表 里 面 的 内 容 打印 出 来 可 以 看 到 ， 
里 面 有 我 们 需要 被 调用 的 具体 冰 数 的 地 址 。 


从 这 里 的 分 析 结 果 可 以 看 到 ，Rust 的 动态 分 派 和 C++ 的 动态 分 派 ， 
内 存 布 局 有 所 不 同 。 在 C++ 里 ， 如 果 一 个 类 型 里 面 有 虚 函 数 ， 那 么 每 一 
个 这 种 类 型 的 变量 内 部 都 包含 一 个 指 同 虚 函 数 表 的 地 址 。 而 在 Rust 里 
面 ， 对 象 本 映 不 包含 指 辐 虚 函 数 表 的 指针 ， 这 个 指针 是 存在 于 trait 
object 指 针 里 面 的 。 如 果 一 个 类 型 实现 了 多 个 trait， 那 么 不 同 的 trait 
object 指 向 的 虚 函 数 表 也 不 一 样 。 











23.2 object safe 


既然 谈 到 trait object 就 不 得 不 说 一 下 object safe 的 概念 。trait object 的 
构造 是 受到 许多 约束 的 ， 当 这 些 约束 条 件 不 能 满足 的 时 候 ， 会 产生 编译 
音 误 。 

我 们 来 看 看 在 哪些 条 件 下 trait object 是 无 法 构造 出 来 的 。 

1. 当 trait 有 Self: Sized 约 束 时 

一 般 情 况 下 ， 我 们 把 trait 当 作 类 型 来 看 的 时 候 ， 它 是 不 满足 Sized 条 
件 的 。 因 为 trait 只 是 描述 了 公共 的 行为 ， 并 不 描述 具体 的 内 部 实现 ， 实 
现 这 个 trait 的 具体 类 型 是 可 以 各 种 各 样 的 ， 占 据 的 空间 大 小 也 不 是 统一 


的 。Self 关 键 字 代 表 的 类 型 是 实现 该 trait 的 具体 类 型 ， 在 impl 的 时 候 ， 针 
对 不 同 的 类 型 ， 有 不 同 的 具体 化 实现 。 如 果 我 们 给 Self 加 上 Sized 约 束 : 








#![feature(dyn_trait)] 

trait Foo where Self: Sized { 
fn foo(&self); 

} 


imp Foo for i32 { 
fn foo(&self) { println!("{}", self); } 
} 


fn main() { 
let x = 1 i32,; 
x.foo(); 
//let p = &x as &dyn Foo; 
//Pp.foo(); 





我 们 可 以 看 到 ， 直 接 调用 函数 foo 依 然 是 可 行 的 。 可 是 ， 当 我 们 试 
图 创建 trait object 的 时 候 ， 编 译 器 阻止 了 我 们 : 





error: the trait ‘Foo cannot be made into an object [E0038] 





所 以 ， 如 果 我 们 不 希望 一 个 trait 通 过 trait object 的 方式 使 用 ， 可 以 为 
它 加 上 Salf: Sized 约 束 。 


同 理 ， 如 果 我 们 想 阻 止 一 个 函数 在 虚 函 数 表 中 出 现 ， 可 以 专门 为 该 
函数 加 上 Self:， Sized 约 束 : 





#![feature(dyn_trait)] 
trait Foo { 

fn fooi(&self); 

fn foo2(&self) where Self: Sized ; 
} 


impl] Foo for i32 { 
fn fooi(&self) { println!("foo1l {}", self); } 
fn foo2(&self) { println!("foo2 {}", self); } 


fn main() { 
let x = 1 i32,; 
x.foo2(); 
let p = &x as &dyn Foo; 
p.foo2(); 





编译 以 上 代码 ， 可 以 看 到 ， 如 果 我 们 针对 foo2 函 数 添加 了 Self; 
Sized 约 束 ， 那 么 就 不 能 通过 trait object 来 调用 这 个 函数 了 。 


2. 当 函数 中 有 Self 类 型 作为 参数 或 者 返回 类 型 时 


Self 类 型 是 个 很 特殊 的 类 型 ， 它 代表 的 是 impl 这 个 trait 的 当前 类 型 。 
比如 说 ，Clone 这 个 trait 中 的 done 方 法 就 返回 了 一 个 Self 类 型 . 





pub trait Clone { 

fn clone(&self) -> Self; 

fn clone_from(&mut self, source: &Self) { ... } 
} 





我 们 可 以 想象 一 下 ， 假 如 我 们 创建 了 一 个 Clone trait 的 trait object， 
并 调用 clone 方 法 : 





let p: &dyn Clone = if from input() { &objl as &dyn Clone } else { &0bj2 as &dyn Cl 
let 0 = p.clone(); 








变量 o 应 该 是 什么 类 型 ? 编译 器 不 知道 ， 因 为 它 在 编译 阶段 无 法 确 
定 。p 指 向 的 具体 对 象 ， 它 的 类 型 是 什么 只 能 在 运行 阶段 确定 ， 无 法 在 
编译 阶段 确定 。 在 编译 阶段 ， 我 们 知道 的 仅仅 是 这 个 类 型 实现 了 Clone 





trait， 其 他 的 就 一 无 所 知 了 。 而 这 个 clone 〈) 方法 又 要 求 返 回 一 个 与 p 
指 同 的 具体 类 型 一 致 的 返回 类 型 ， 所 以 o 的 类 型 是 无 法 确定 的 。 对 编译 
器 来 说 ， 这 是 无 法 完成 的 任务 。 所 以 ，std: : clone: : Clone 这 个 trait 
就 不 是 object safe 的 ， 我 们 不 能 利用 &dyn Clone 构 造 trait object 来 实现 虚 
函数 调用 。 


编译 下 面 的 代码 : 





#![feature(dyn_trait)] 
fn main() { 

let s = String: :new(); 

let p : &dyn Clone = &s as &dyn Clone(); 
} 





编译 器 会 提示 错误 : 





error: the trait ‘std::clone::Clone. cannot be made into an object 





Rust 规 定 ， 如 果 函 数 中 除了 self 这 个 参数 之 外 ， 还 在 其 他 参数 或 者 
返回 值 中 用 到 了 Salf 类 型 ， 那 么 这 个 函数 束 不 是 object safe 的 。 这 样 的 函 
2 object 来 调用 的 。 这 样 的 方法 是 不 能 在 虚 函 数 表 中 存 
十 的 。 


这 样 的 规定 在 茶 些 情况 下 会 给 我 们 造成 一 定 的 困扰 。 假 如 我 们 有 下 
面 这 样 一 个 trait， 它 里 面 的 一 部 分 方法 是 满足 object safe 的 ， 而 妨 外 一 部 
分 是 不 满足 的 : 





#![feature(dyn_trait)] 
trait Double { 

fn new() -> Self; 

fn double(&mut self); 
} 


impl Double for i32 { 

fn new() -> i32 { 0} 

fn double(&mut self) { *self *= 2; } 
} 


fn main() { 
let mut i = 1; 
let p : &mut dyn Double = &mut i as &mut dyn Double; 
p.double( ); 


编译 会 出 错 ， 因 为 new 〈) 这 个 方法 是 不 满足 object safe 条 件 的 。 但 
是 我 们 其 实 只 想 在 trait object 中 调用 double 方 法 ， 并 不 指望 通过 trait 
object 调 用 new() 方法 ， 但 可 惜 编译 占 还 是 直接 禁止 了 这 个 trait object 
的 创建 。 


面 对 这 样 的 情况 ， 我 们 应 该 怎么 处 理 呢 ? 我 们 可 以 通过 下 面 的 写 
法 ， 把 new() 方法 从 trait object 的 虚 函 数 表 中 移 除 : 








fn new() -> Self where Self: Sized 





把 这 个 方法 加 上 Self: Sized 约 束 ， 编 译 器 就 不 会 在 生成 虚 函 数 表 的 
时 候 考 虑 它 了 。 生 成 trait object 的 时 候 ， 只 需 考 虑 double〈() 这 一 个 方 
法 ， 编 详 器 融会 很 愉快 地 创建 这 样 的 虚 函 数 表 和 trait object。 通 过 这 种 

方式 ， 我 们 就 可 以 解雇 抒 一 个 trait 中 一 部 分 方法 不 满足 object safe 的 烦 


恼 。 
3. 当 函数 第 一 个 参数 不 是 self 时 

意思 是 ， 如 果 有 “静态 方法 ”， 那 这 个 “静态 方法 "是 不 满足 object safe 
条 作 的 。 Re ， 显然 的 ， 编 译 器 没有 办 法 把 静态 方法 加 入 到 虚 

函数 表 中 。 

与 上 面 讲解 的 情况 类 似 ， 如 果 一 个 trait 中 存在 静态 方法 ， 而 又 和 硕 望 
通过 trait object 来 调用 其 他 的 方法 ， 那 么 我 们 需要 在 这 个 静态 方法 后 面 
加 上 Self: Sized 约 束 ， 将 它 从 虚 函 数 表 中 剔除 。 

4. 当 函数 有 泛 型 参数 时 


假如 我 们 有 下 面 这 样 的 trait: 








trait SomeTrait { 
fn generic_fn<A>(&self, value: A); 


} 








个 函数 带 有 一 个 泛 型 参数 ， 如 果 我 们 使 用 trait object 调 用 这 个 函 
数 : 


fn func(x: &dyn SomeTrait) { 
x.generic_fn("foo"); // A = &str 
x.generic fn(1 uvu8); //A= u8 
} 





这 样 的 写法 会 让 编译 器 特别 犯难 ， 本 来 x 是 trait object， 通 过 它 调用 
成 员 的 方法 是 通过 vtable 虚 函数 表 来 进行 查找 并 调用 。 现 在 需要 被 查找 
的 函数 成 了 泛 型 函数 ， 而 泛 型 函数 在 Rust 中 是 编译 阶段 自动 展开 的 ， 
generic fm 函数 实际 上 有 许多 不 同 的 版 本 。 这 里 有 一 个 根本 性 的 冲突 问 
题 。Rust 选 择 的 解决 方案 是 ， 人 禁止 使 用 trait object 来 调用 泛 型 函数 ， 泛 型 
函数 是 从 虚 函 数 表 中 剔除 了 的 。 这 个 行为 跟 C++ 是 一 样 的 。C++ 中 同样 
规定 了 类 的 虚 成 员 函 数 不 可 以 是 template 方 法 。 











23.3 impl trait 


本 节 所 讲 的 impl trait 是 一 个 全 新 的 语法 。 比 如 下 这 样 : 





fn foo(n: u32) -> impl Iterator<Item=u32> { 
(0..n).map(|x| x * 100) 





下 面 我 们 来 讲解 impl Iterator<Item=u32>。 


我 们 注意 到 ， 在 写 泛 型 函数 的 时 候 ， 参 数 传递 方式 可 以 有 : 静态 分 
派 或 动态 分 派 两 种 选择 : 





fn consume_iter_static<I: Iterator<Item=u8>>(iter: I) 
fn consume_iter_dynamic(iter: Box<dyn Iterator<Item=u8>>) 





不 论 选 用 哪 种 方式 ， 都 可 以 写 出 针对 一 组 类 型 的 抽象 代码 ， 而 不 是 
针对 某 一 个 具体 类 型 的 。 在 consume iter_static 版 本 中 ， 每 次 调用 的 时 
修 ， 编 译 嚣 都 会 为 不 同 的 实 参 类 型 实例 化 不 同 版 本 的 函数 。 在 
consume _iter_dynamic 版 本 中 ， 每 次 调用 的 时 候 ， 实 参 的 具体 类 型 隐藏 
a object 的 后 面 ， 通 过 虚 函 数 表 ， 在 执行 阶段 选择 调用 正确 的 函 


这 两 种 方式 都 可 以 在 函数 参数 中 正常 使 用 。 但 是 ， 如 果 我 们 考虑 函 
数 的 返回 值 ， 目 前 只 有 这 样 一 种 方式 是 合法 的 : 











fn produce_iter_dynamic() -> Box<dyn Iterator<Item=u8>> 





以 下 这 种 方式 是 不 合法 的 : 





fn produce_iter_static() -> Iterator<Item=u8> 





目前 版 本 中 ，Rust 只 支持 返回 “具体 类 型 *， 而 不 能 返回 一 个 trait。 
由 于 缺少 了 “不 装 箱 的 抽象 返回 类 型 > 这 样 一 种 机 制 ， 导 致 了 以 下 这 些 问 


匮 。 





:我们 返回 一 个 复 某 的 达 代 器 的 时 候 ， 会 让 返回 类 型 过 于 复杂 ， 而 
且 泄 漏 了 具体 实现 。 比 如 ， 如 果 我 们 需要 返回 一 个 栈 上 的 迭代 器 ， 可 能 
需要 为 水 数 写 复杂 的 返回 类 型 : 











Chain<Map<'a, (int, u8), u16, Enumerate<Filter<'a, u8, vec::MoveItems<u8>>>>, Skipwt 








疯 数 内 部 的 逻辑 稍微 有 点 变化 ， 这 个 返回 类 型 就 要 跟着 改变 ， 远 不 
如 泛 型 函数 参数 T，Iterator 的 抽象 程度 好 。 


:函数 无 法 直接 返回 一 个 财 包 。 因 为 财 包 的 类 型 是 编译 器 上 自动 生成 
的 一 个 匿名 类 型 ， 我 们 没 办 法 在 函数 的 返回 类 型 中 手工 指定 ， 所 以 返回 
人 
性 能 开销 的 。 














fn multiply(m: i32) -> Box<dyn Fn(i32)->i32> { 
Box: :new(move |x|x*m) 
} 


fn main() { 
let f = multiply(5); 
println!("{}", f(2)); 











请 注意 ， 这 种 时 候 引 入 一 个 泛 型 参数 代表 这 个 财 包 是 行 不 通 的 : 





fn multiply<T>(m: i32) -> T where T:Fn(i32)->i32 { 
move |x|x*m 
} 


fn main() { 
let f = multiply(5); 
println!("{}", f(2)); 
} 





编译 出 错 ， 编 译 错误 为 : 





note: expected type °T. 
found type ‘ [closure@test.rs:3:5: 3:16 m:_ ] 











因为 泛 型 这 种 语法 实际 的 意思 是 ， 泛 型 参数 T 由 “调用 者 ”决定 。 比 
如 std: : lter: : Iterator: : collect 这 个 函数 就 非常 适合 这 样 实现 : 





let a = [1, 2, 3]; 

let doubled = a.iter() 
.map(|&x| x * 2) 
.collect::<??7?>::(); 





使 用 者 可 以 在 ? ? ? 这 个 地 方 填充 不 同 的 类 型 ， 如 Vec<i32>、 
VecDeque<i32>、LinkedList<i32> 等 。 这 个 collect 方 法 的 返回 类 型 是 一 个 
抽象 的 类 型 集合 ， 调 用 者 可 以 随意 选择 这 个 集合 中 的 任意 一 个 具体 类 
型 。 


这 跟 我 们 上 面 想 返 回 一 个 内 部 的 闭 包 情况 不 同 ， 上 面 的 程序 想 表 达 
的 是 返回 一 个 “具体 类 型 ”， 这 个 类 型 是 由 被 调用 的 函数 自行 决定 的 ， 只 
是 调用 者 不 知道 它 的 名 字 而 已 。 

为 了 解决 上 面 的 问题 ，aturon 提 出 了 impl trait 这 个 方案 。 此 方案 引 
A 
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示例 如 下 : 





#![feature(conservative_ impl_ trait)] 


fn multiply(m: i32) -> impl] Fn(i32)->i32 { 
move |x|x*m 
} 


fn main() { 
let f = multiply(5); 
println!("{}", f(2)); 
} 





这 里 的 impl Fn (i32〉->i32 表 示 ， 这 个 返回 类 型 ， 虽 然 我 们 不 知道 
它 的 具体 名 字 ， 但 是 知道 它 满足 Fn (size) ->isize 这 个 trait 的 约束 。 因 
此 ， 它 解决 了 “返回 不 装 箱 的 抽象 类 型 ”问题 。 


它 跟 泛 型 函数 的 主要 区 别 是 : 泛 型 函数 的 类 型 参数 足 函 数 的 调用 者 
指定 的 ，impltrait 的 具体 类 型 是 函数 的 实现 体 指定 的 。 





为 什么 这 个 功能 开关 名 称 是 #! [feature (conservative_impl] trait) ] 
呢 ? 因为 目前 为 止 ， 它 的 使 用 场景 非常 保守 ， 只 允许 这 个 语法 用 于 普通 
函数 的 返回 类 型 ， 不 能 用 于 参数 类 型 等 其 他 地 方 。 实 际 上 设计 组 已 经 通 
过 了 另外 一 个 RFC， 将 这 个 功能 扩展 到 了 更 多 的 场景 ， 但 是 这 些 功 能 目 
前 在 编译 器 中 还 没有 实现 。 


让 impl trait 用 在 函数 参数 中 : 








fn test(f: impl Fn(i32)->i32){} 





“让 impl trait 用 在 类 型 别名 中 : 





type MyIter = impl Iterator<Item=i32>; 





让 impl trait 用 在 trait 中 的 方法 参数 或 返回 值 中 : 





trait Test 
fn test() -> impl MyTrait; 








让 impl Trait 用 在 trait 中 的 关联 类 型 中 : 





trait Test { 
type AT = impl MyTrait; 
} 





在 菏 些 场景 下 ，impl trait 这 个 语法 具有 明显 的 优势 ， 因 为 它 可 以 所 
高 语言 的 表达 能 力 。 但 是 ， 要 把 它 推 广 到 各 个 场景 下 使 用 ， 还 需要 大 量 
的 设计 和 实现 工作 。 目 前 的 这 个 RFC 将 目标 缩小 为 了 : 先 推进 这 个 语法 
在 函数 参数 和 返回 值 场 景 下 使 用 ， 其 他 的 情况 后 面 再 考虑 。 


最 后 需要 跟 各 位 读者 提醒 一 点 的 是 ， 不 要 过 于 激进 地 使 用 这 个 功 
能 ， 如 在 每 个 可 以 使 用 impl trait 的 地 方 都 用 它 蔡 换 原来 的 具体 类 型 。 它 
更 多 地 倾向 于 简洁 性 ， 而 牺牲 了 一 部 分 表达 能 力 。 比 如 拿 前 文 那个 复杂 
的 迭代 器 类 型 来 说 ， 














fn test() -> Chain<Map<...>> 





我 们 可 能 希望 将 函数 返回 类 型 写成 下 面 这 样 : 





fn test() -> impl Iterator<Item=U16> 





在 绝 大 多 数 应 用 场景 下 ， 这 样 写 更 精简 、 更 清晰 。 但 是 ， 这 样 写实 
际 上 是 降低 了 表达 能 力 。 因 为 ， 使 用 前 一 种 写法 ， 用 户 可 以 拿 到 这 个 迭 
代 器 之 后 再 调用 clone () 方法 ， 而 使 用 后 一 种 写法 ， 融 不 可 以 了 。 如 果 
希望 支持 clone， 那 么 需要 像 下 面 这 样 写 





fn test() -> impl Iterator<Item=u16> + Clone 








而 这 两 个 trait 依 然 不 是 原来 那个 具体 类 型 的 所 有 对 外 接口 。 在 某 些 
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fn test() -> impl Iterator<Item=u16> + 
Clone + 
EXactSizeIterator+ 
TrustedLen 








先 不 管 这 种 写法 是 否 可 行 ， 单 说 这 个 复杂 程度 ， 就 已 经 完全 失去 了 
impl trait 功 能 的 意义 了 。 所 以 ， 什 么 时 候 该 用 这 个 功能 ， 什 么 时 候 不 该 
用 ， 应 该 仔细 权衡 一 下 。 
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跟 C++ 的 STL 类 似 ，Rust 的 标准 库 也 给 我 们 提供 了 一 些 比较 第 用 的 
容 露 以 及 相关 的 迭代 器 。 目 前 实现 了 的 容器 有 : 


























容 器 描 述 
Vec 可 变 长 数组 ， 连 续 存 储 
VecDeque 双 轴 队列， 适用 于 从 头 部 和 尾部 插入 删除 数据 
LinkedList 双 疝 链表 ， 非 连续 存储 
HashMap 基于 Hash 算法 存储 一 系列 键 值 对 
BTreeMap 基于 B 树 存 储 一 系列 刍 值 对 
HashSet 基于 Hash 算法 的 集合 ， 相 当 于 没有 值 的 HashMap 
BTreeSet 基于 B 树 的 集合 ， 相 当 于 没有 值 的 BTreeMap 
BinaryHeap 基于 二 义 堆 实现 的 优先 级 队列 


下 面 选 择 几 个 种 见 的 命令 来 讲解 它们 的 用 法 及 特点 。 


24.1.1 Vec 


Vec 是 最 第 用 的 一 个 容器 ， 对 应 C++ 里 面 的 vector。 它 就 是 一 个 可 以 
目 动 扩展 容量 的 动态 数组 。 它 重 载 了 Index 运 算 符 ， 可 以 通过 中 括号 取 
下 标的 形式 访问 内 部 成 员 。 它 还 重 载 了 Deref/DerefMnut 运 算 符 ， 因 此 可 
以 自动 被 郁 引 用 为 数组 切片 。 


常见 用 法 示例 如 下 : 














fn main() { 


// 常见 的 几 种 构造 Vec 的 方式 

// 1. new() 方法 与 default() 方法 一 样 , 构造 一 个 空 的 Vec 

let vi = Vec::<i32>::new(); 

// 2. with_capacity() 方法 可 以 预先 分 配 一 个 较 大 空间 , 避免 插入 数据 的 时 候 动态 扩容 
let v2 : Vec<String> = Vec::with_capacity(1000); 

// 3， 利 用 宏 来 初始 化 , 语法 跟 数 组 初始 化 类 似 

let v3 = vec![1,2,3]; 


// 插入 数据 



































let mut v4 = Vec::new(); 

// 多 种 插入 数据 的 方式 

v4.push(1); 

v4.extend_from slice(&[10,20,30,40,50]); 

v4.insert(2, 100); 

println!("capacity: {} length: {}", v4.capacity(), v4.1en()); 





// 访问 数据 
// 调用 IndexMut 运算 符 , 可 以 写 入 数据 
v4[5] = 5; 
let i = v4[5]; 
println!i("{}", 1); 
// Index 运算 符 直接 访问 , 如 果 越 界 则 会 造成 panic, 而 get 方法 不 会 , 因为 它 返 回 一 个 0ption<T> 
if let Some(i) = v4.get(6) { 
println!("{}", 1); 
























































} 

// Index 运算 符 支 持 使 用 各 种 Range 作为 索引 
let slice = &v4[4..]; 

println!("{:?}", slice); 

















以 上 示例 包含 了 Vec 中 最 第 见 的 一 些 操作 ， 还 有 许多 有 用 的 方法 ， 
不 方便 在 本 书 一 一 罗列 ， 各 位 读者 可 以 参考 标准 文档 。 


一 个 Vec 中 能 存储 的 元 素 个 数 最 多 为 std: : usize: : MAX 个 ， 超 过 
了 会 发 生 panic。 因 为 它 记录 元 素 个 数 ， 用 的 就 是 usize 类 型 。 如 果 我 们 
指定 元 素 的 类 型 是 0 大 小 的 类 型 ， 那 么 ， 这 个 Vec 根 本 不 需要 在 堆 上 分 配 
任何 空间 。 另 外 ， 因 为 Vec 里 面 存 在 一 个 指向 堆 上 的 指针 ， 它 永远 是 非 
空 的 状态 ， 编 译 器 可 以 据 此 做 优化 ， 使 得 size_of: 
<Option<Vec<T>>> () ==size_of: : <Vec<T>> () 。 示 例如 下 : 














struct ZeroSized{} 


fn main() { 
let mut v = Vec::<ZeroSized>: :new(); 
println!("capacity:{} length:{}", v.capacity(), v.1len()); 


Vv.push(ZeroSized{}); 
Vv.push(ZeroSized{}); 
printlin!("capacity:{} length:{}", v.capacity(), v.1len()); 











// p 永远 指向 align_of: :<ZeroSized>( ), 不 需要 调用 allocator 
let p = v.as_ptr(); 
println!i("ptr:{:p}", p); 








let size1 = std::mem::size of::<Vec<i32>>(); 
let size2 = std::mem::size_of::<Option<Vec<i32>>>(),， 
println!("size of Vec:{} Size of option vec:{}", sizel1, size2); 








编译 执行 ， 可 得 结果 为 : 





capacity:18446744073709551615 length:0 
capacity:18446744073709551615 length:2 
ptr :Ox1 

size of Vec:24 size of option vec:24 





将 来 类 似 Vec 的 这 些 容器 ， 还 会 像 C++ 一 样 ， 支持 一 个 新 的 泛 型 参 
数 ， 人 允许 用 户 目 定义 allocator。 这 部 分 目前 还 没有 定 下 来 ， 因 此 就 不 深 
入 讨论 了 。 





24.1.2 VecDedque 


VecDeque 是 一 个 双 同 队列 。 在 它 的 头 部 或 者 尾部 执行 添加 或 者 市 
除 操作 ， 都 是 效率 很 高 的 。 它 的 用 法 和 Vec 非 常 相似 ， 主要 是 多 了 
pop_front 〈) push_front 〈() 等 方法 。 


基本 用 法 示例 如 下 : 





use std::collections::VecDeque; 


fn main() { 
let mut queue = VecDeque: :with_ capacity(64); 
// 向 尾部 按 顺序 插入 一 堆 数 据 
for i in 1..10 { 
queue.push_back(i); 





} 
// 从 头 部 按 顺 序 一 个 个 取出 来 
while let Some(i) = queue.pop_front() { 
println!("{}", i); 








24.1.3 HashMap 


HashMap<K，V，S> 是 基于 hash 算 法 的 存储 一 组 键 值 对 (key-value- 
pair) 的 容器 。 其 中 ， 泛 型 参数 K 是 键 的 类 型 ，V 是 值 的 类 型 ，S 是 哈 希 
算法 的 类 型 。S 这 个 泛 型 参数 有 一 个 默认 值 ， 平 时 我 们 使 用 的 时 候 不 需 
要 手动 指定 ， 如 果 有 特殊 需要 ， 则 可 以 自 定 义 哈 希 算法 。 








hash 算 法 的 关键 是 ， 将 记录 的 存储 地 址 和 key 之 间 建 立 一 个 确定 的 
对 应 关系 。 这 样 ， 当 想 查 找 某 条 记录 时 ， 我 们 根据 记录 的 key， 通 过 一 
次 函数 计算 ， 就 可 以 得 到 它 的 存储 地 址 ， 进 而 快速 判断 这 条 记录 是 否 存 
在 、 存 储 在 哪里 。 因 此 ，Rust 的 HashMap 要 求 ，key 要 满足 Eq+Hash 的 约 
本 Eq trait 代 表 这 个 类 型 可 以 作 相 等 比较 ， 并 且 一 定 满 足下 列 三 个 性 
质 : 


= 











自 反 性 一 一 对 任意 a， 满 足 a==a; 

:对 称 性 一 一 如 果 a==b 成 立 ， 则 b==a 成 立 ; 
-传递 性 一 一 如 果 a==b 且 b==c 成 立 ， 则 a==c 成 并。 
而 Hash trait 更 重要 ， 它 的 定义 如 下 : 





trait Hash { 
fn hash<H: Hasher>(&self, state: &mut H); 


} 
trait Hasher { 


fn finish(&self) -> u64; 
fn write(&mut self, bytes: &[u8]); 








如 末 一 个 类 型 ， 实 现 了 Hash， 给 定 了 一 种 哈 希 算法 Hasher， 融 能 计 
算出 一 个 u64 类 型 的 哈 硕 值 。 这 个 哈 希 值 吏 是 HashMap 中 计算 存储 位 置 
的 关键 。 


一 般 来 说 ， 手 动 实现 Hash trait 的 写法 类 似 下 面 这 样 : 











struct Person { 
first_name: String, 
last_name: String, 


} 


impl Hash for Person { 
fn hash<H: Hasher>(&self, state: &mut H) { 
self.first_name.hash(state); 
self.]last_name.hash(state); 
} 
} 


[ee | 


这 个 hash 方 法 基本 上 就 是 重复 性 的 代码 ， 因 此 编译 器 提供 了 自动 
derive 来 帮 我 们 实现 。 下 面 这 种 写法 才 是 平时 见得 最 多 的 : 











#[derive(Hash)] 

struct Person { 
first_name: String, 
last_name: String, 





一 个 完整 的 使 用 HashMap 的 示例 如 下 : 





use std::collections::HashMap; 


#[derive(Hash, Eq, PartialEq, Debug)] 
struct Person { 

first_name: String, 

last_name: String, 


} 


impl Person { 
fn new(first: &str, last: &str) -> Self { 
Person { 
first_name: first.to_string()， 
last_name: last.to_string(), 
} 
} 


fn main() { 
let mut book = HashMap: :new(); 
book.insert(Person: :new("John", "Smith"), "521-8976"); 
book.insert(Person: :new("Sandra", "Dee"), "521-9655"); 
book.insert(Person: :new("Ted", "Baker"), "418-4165"); 


let p = Person::new("John", "Smith"); 


// 查找 键 对 应 的 值 
If let Some(phone) = book.get(&p) { 
println!("Phone number found: {}", phone); 


// 删除 
book.remove(&p); 


// 查询 是 否 存 在 
println!("Find key: {}", book.contains_ key(&p)); 








HashMap 的 查找 、 插 入 、 删 除 操作 的 平均 时 间 复 杂 撒 都 是 O (1)。 
在 这 个 例子 中 ，HashMap 内 部 的 存储 状态 类 似 下 图 所 示 : 


keys buckets 
001 521-8976 


John Smith 002 


Lisa Smith 





152 John Smith 521-1234 
Ted Baker 418-4165 


Sam Doe 





Sandra Dee 


Ted Baker 








除了 上 面 例子 中 演示 的 这 些 方法 外 ，HashMap 还 设计 了 一 种 叫 作 
entry 的 系列 API。 考 虑 这 样 的 一 种 场景 ， 我 们 需要 先 查 看 某 个 key 是 耕 存 
在 ， 然 后 再 做 插入 或 删除 操作 。 这 种 时 候 ， 如 果 我 们 用 传统 的 API， 那 
么 束 需 要 执行 两 裔 查找 的 操作 : 








if map.contains_key(key) { // 执行 了 一 遍 hash 查 找 的 工作 
map.insert(key，value); // 又 执行 了 一 遍 hash 查 找 的 工作 
} 














如 果 我 们 用 entry API， 则 可 以 提高 效率 ， 而 且 代码 也 更 流畅 : 





map.entry(key).or_insert(value); 





HashMap 也 实现 了 迭代 器 ， 使 我 们 可 以 直接 志 有 历 整 个 容 句 ， 这 部 分 
内 容 放 到 后 面 沈 代 器 部 分 讲解 。 


HashMap 里 面 ，key 存 储 的 位 置 跟 它 本 身 的 值 密切 相关 ， 如 果 key 本 
吴 变 了 ， 那 么 它 存 放 的 位 置 也 需要 相应 变化 。 所 以 ，HashMap 设 计 的 各 
种 API 中 ， 指 同 key 的 借用 一 般 是 只 读 借 用， 防止 用 户 修改 它 。 但 是 ， 只 
读 借用 并 不 能 完全 保证 它 不 被 修改 ， 读 者 应 该 能 想到 ， 只 读 借用 依然 可 
以 改变 具备 内 部 可 变性 特点 的 类 型 。 下 面 这 个 示例 演示 了， 如 果 我 们 动 
态 修改 了 HashMap 中 的 key 值 ， 会 出 现 什么 后 果 : 





use std::hash::{Hash, Hasher}; 
use std::collections::HashMap; 
use std::cell::Cell; 


#[derive(Eq, PartialEq)] 
Struct BadKey { 

Value: Cell<i32> 
} 


impl] BadKey { 
fn new(v: i32) -> Self { 
BadKey { value: Cell::new(v) } 


} 


impl Hash for BadKey { 
fn hash<H: Hasher>(&self, state: &mut H) { 
self.value.get().hash(state); 
} 
} 


fn main() { 
Jet mut map = HashMap: :new(); 
map.insert(BadKey: :new(1), 100); 
map.insert(BadKey: :new(2), 200); 


for key in map.keys() { 
key.value.set(key.value.get() * 2); 
} 


println!("Find key 1:{:?}", map.get(&BadkKey::new(1))); 
println!("Find key 2:{:?}", map.get(&BadkKey: :new(2))); 
println!("Find key 4:{:?}", map.get(&BadkKey: :new(4))); 





在 上 面 的 示例 中 ， 我 们 设计 了 一 个 具备 内 部 可 变性 的 类 型 作为 
key。 然 后 直接 在 容器 内 部 把 它 的 值 改变 ， 接 下 来 继续 做 查找 。 可 以 看 
到 ， 我 们 再 也 找 不 到 这 几 个 key 了 ， 不 论 是 用 修改 前 的 key 值 ， 还 是 用 修 
改 后 的 key 值 ， 都 找 不 到 。 这 种 错误 属于 逻辑 错误 ， 是 编译 器 无 法 静态 
检查 出 来 的 。 所 有 关联 容器 ， 比 如 HashMap、HashSet、BTreeMap、 
BTreeSet 等 都 存在 这 样 的 情况 ， 使 用 者 需要 自己 避免 。 








标准 库 中 的 HashSet 类 型 就 不 再 展开 讲解 了 ， 它 跟 HashMap 非 常 类 
似 ， 主 要 区 别 在 于 它 只 有 key 没 有 value， 从 源码 定义 我 们 也 可 以 看 到 : 





struct HashSet<T, S = RandomState> { 
map: HashMap<T, (), S>, 





24.1.4 BTIreeMap 


BTreeMap<K，V> 是 基于 B 树 数据 结构 的 存储 一 组 键 值 对 (key- 
value-pair) 的 容器 。 它 跟 HashMap 的 用 途 相似 ， 但 是 内 部 存储 的 机 制 不 
同 。B 树 的 每 个 节点 包含 多 个 连续 存储 的 元 素 ， 以 及 多 个 子 节点 。B 树 
的 结构 如 下 图 所 示 : 









BTreeMap 对 key 的 要 求 是 满足 Ord 约 束 ， 即 具备 “全 序 ” 特 征 。 前 文 
中 关于 Hash-Map 的 示例 也 可 以 用 BTreeMap 重 写 ， 从 中 我 们 可 以 看 到 它 
的 基本 用 法 与 HashMap 很 相似 : 





use std::collections::BTreeMap; 


#[derive(Ord, PartialoOrd, Eq, PartialEq, Debug)] 
struct Person { 

first_name: String, 

last_name: String, 


} 


impl Person { 
fn new(first: &str, last: &str) -> Self { 
Person { 
first_name: first.to_ string(), 
last_name: last.to_string(), 
} 
} 


fn main() { 
let mut book = BTreeMap: :new(); 
book.insert(Person: :new("John", "Smith"), "521-8976"); 
book.insert(Person: :new("Sandra", "Dee"), "521-9655"); 
book.insert(Person: :new("Ted", "Baker"), "418-4165"); 


let p = Person::new("John", "Smith"); 


// 查找 键 对 应 的 值 
If let Some(phone) = book.get(&p) { 
println!("Phone number found: {}", phone); 


// 删除 
book.remove(&p); 


// 查询 是 否 存 在 
println!("Find key: {}", book.contains_ key(&p)); 








同样 ，BTreeMap 也 实现 了 entry API。BTreeMap 也 实现 了 人 迭代 器 ， 
同样 可 以 直接 遍历 。 但 是 HashMap 在 遍历 的 时 候 ， 是 不 保证 遍历 结果 顺 
， 而 BTreeMap 上 自动 把 数据 排 好 序 了 ， 它 过 历 结 果 一 定 是 按 固 定 顺 
Hs 


BTreeMap 比 HashMap 多 的 一 项 功能 是 ， 它 不 仅 可 以 得 询 单个 key 的 
结果 ， 还 可 以 查询 一 个 区 间 的 结果 ， 示 例如 下 : 














use std::collections::BTreeMap; 


fn main() { 
let mut map = BTreeMap: :new(); 
map.insert(3, "a"); 
map.insert(5, "b"); 
map.insert(8, "c"); 
for (k, v) in map.range(2..6) { 
printlin!("{} : {}", k, v); 








} 
} 
执行 结果 是 
3:a 
5 : b 





当然 ， 我 们 还 可 以 使 用 其 他 的 Range 类 型 ， 如 RangeInclusive 等 ， 在 


此 就 不 次 述 了 。 


对 应 的 ， 标 准 库 中 的 BTreeSet 类 型 束 不 再 展开 讲解 了 ， 它 跟 
BTreeMap 非 常 类 似 ， 主 要 区 别 在 于 它 只 有 key 没 有 value， 从 源码 定义 我 
们 也 可 以 看 到 : 








struct BTreeSet<T> { 
map: BTreeMap<T, ()>, 
} 





24.2 和 进 代 蜗 


迭代 器 是 Rust 的 一 项 重要 功能 。Rust 的 迭代 器 是 指 实现 了 Iterator 
trait 的 类 型 。 这 个 Iterator trait 的 定义 如 下 : 





trait Iterator { 
type Item; 
fn next(&mut self) -> Option<Self::Item>,; 





它 最 主要 的 一 个 方法 就 是 next() ， 返 回 一 个 Option<Item>。 一 般 
情况 返回 Some (Item) ; 如 果 和 迭代 完成 ， 了 驶 返回 None。 


24.2.1 实现 欠 代 器 


接 下 来 我 们 试 一 下 如 何 实 现 一 个 迭代 器 。 假 设 我 们 的 目标 是 ， 这 个 
和 迭代 器 会 生成 一 个 从 1 到 100 的 序列 。 我 们 需要 创建 一 个 类 型 ， 这 里 使 用 
struct， 它 要 实现 Iterator trait 。 注意 到 每 次 调用 next 方 法 的 时 候 ， 它 都 返 
回 不 同 的 值 ， 所 以 它 一 定 要 有 一 个 成 员 ， 能 记录 上 次 返回 的 是 什么 。 完 
整 代码 如 下 : 





use std::iter::Iterator; 


struct Seq { 
current : i32 


} 
impl Seq { 
fn new() -> Self { 
Seq { current: 0 } 
} 


impl Iterator for Seq { 
type Item = i32; 


fn next(&mut self) -> Option<i32> { 
If self.current < 100 { 
self.current += 1; 
return Some(self.current); 
} else { 
return None; 


} 
} 
} 


fn main() { 
let mut seq = Seq::new(); 
while let Some(i) = seq.next() { 
println!("{}", 1); 
} 


} 








编译 执行 ， 可 见 结果 和 预期 一 样 。 
24.22 选 代 呈 的 组 千 


是 Rust 标 准 库 有 一 个 命名 规范 ， 从 容 占 创造 出 迭代 絮 一 般 有 三 种 方 
法 : 


:iter () 创造 一 个 Item 是 &T 类 型 的 从 代 器 ; 
'iter_ mut () 创造 一 个 Item 是 &mnut T 类 型 的 迭代 堪 ; 
:into_iter () 创造 一 个 Item 是 T 类 型 的 迭代 器 。 


比如 ， 用 Vec 示 例如 下 : 





fn main() { 
let v = vec![1,2,3,4,5]; 
let mut iter = v.iter(); 
while let Some(i) = iter.next() { 
println!("{}", 1); 
} 
} 





如 果 达 代 器 就 是 这 么 简单 ， 那 么 它 的 用 处 基本 就 不 大 了 。Rust 的 达 
代 吉 有 一 个 重要 特点 ， 那 它 就 是 可 组 合 的 〈composability) 。 我 们 在 前 
面 演 示 的 迭代 器 的 定义 ， 实 际 上 省 略 了 很 大 一 部 分 内 容 ， 去 官方 文档 去 
查 一 下 ， 可 以 看 到 Tterator trait 里 面 还 有 一 大 堆 的 方法 ， 比 如 nth、map、 
filter、skip_while、take 等 等 ， 这 些 方 法 都 有 默认 实现 ， 它 们 可 以 统称 为 
adapters (适配器 〉。 它 们 有 个 共性 ， 返 回 的 是 一 个 具体 类 型 ， 而 这 个 
类 型 本 和 映 也 实现 了 Tterator trait。 这 意味 着 ， 我 们 调用 这 些 方法 可 以 从 一 
个 迭代 器 创造 出 一 个 新 的 迭代 串 。 








我 们 用 示例 来 演示 一 下 这 些 适 配器 的 威力 : 





fn main() { 


let v = vec![1,2,3,4,5,6,7,8,9]; 
let mut iter = v.iter() 
.take(5) 


.filter(|&x| x % 2 == 0) 
.map(|&x| x * x) 
.enumerate( ); 
while let Some((i, = = iter.next() { 
printlin!("{} {}", i, v); 
} 
} 








这 种 写法 很 有 点 “声明 式 ”编程 的 味道 。 函数 名 本 身 就 代表 了 用 户 
的 “意图 ”， 它 表达 的 重点 是 “我 想 做 什么 ”， 而 不 是 具体 怎么 做 。 这 个 跟 
Cyling 很 相似 。 如 果 我 们 用 传统 的 储 环 米 写 这 些 广 辑 ， 这 眉 代 码 关公 
下 面 这 样 





fn main() { 
let v = vec![1,2,3,4,5,6,7,8,9]; 
let mut iter = v.iter(); 
let mut count = 0; 
let mut index = 0; 
while let Some(i) = iter.next() { 
If count < 5 { 
count += 1; 
if (*i) %2 == 0 
let s = (*i) * (™ 和 
println!("{} {}", index, s); 
index += 1; 


} 
} else { 
break; 
} 


} 
} 








上 面 这 种 写法 ， 源 代码 更 倾 癌 于 实现 细节 。 两 个 版 本 相 比较 ， 友 代 
融 的 可 读 性 是 不 言 而 喻 的 。 这 种 抽象 相 比 于 直接 在 传统 的 循环 内 部 写 各 
种 逻辑 是 有 优势 的 ， 特 别 是 在 后 文 “ 并 行 ? 的 章节 中 我 们 可 以 看 到 ， 如 宋 
我 们 四 把 狗 代 器 改 成 并 行 执行 是 非 和 容易 的 事情 。 而 传统 的 写法 涉及 细 
市 太 多 ， 不 太 容 易 改 成 并 行 执行 。 一 个 题 外 话 ， 达 代 器 的 可 组 合 性 是 
一 个 非常 大 的 优点 ， 新 版 C+ 标准 中 引入 了 ranges 这 个 座 ， 主 要 就 是 为 
了 解决 这 个 问题 。) 








上 面 分 析 迭 代 喜 的 实现 原理 我 们 也 可 以 知道 : 构造 一 个 迭代 喜 
本 喘 ， 因为 它 只 是 初始 化 了 一 个 对 象 ， 全 
生 或 消费 数据 。 不 论 欠 代 堪 内 部 能 套 了 多 少 层 ， 最 终 消费 数据 还 是 
过 调用 next 〈) 方法 实现 的 。 这 个 特点 ， 也 被 和 尔 为 惰性 求 值 (lazy 
evaluation〉。 也 就 是 说 ， 如 果 用 户 写 了 下 和 面 这 样 的 代码 : 





lJet v = vec![1, 2, 3, 4, 5 
Vv.iter().map(|x| printin!l ‘fy, xX 





实际 上 是 什么 事 都 没 做 。 因 为 map 方 法 只 是 把 前 面 一 个 迭代 器 包装 
一 下 ， 构 造 一 个 新 的 迭代 器 而 已 ， 没 有 真正 读 取 容 器 内 部 的 数据 。 





24.2.3 for 循环 


在 前 面 的 示例 中 ， 我 们 都 是 手工 直接 调用 迭代 器 的 next() 方法 ， 
然后 使 用 while let 语 法 来 做 循环 。 实 际 上 ，Rust 里 面 更 简洁 、 更 目 然 地 
使 用 达 代 器 的 方式 是 使 用 for 循 环 。 本 质 上 来 说 ，for 循 环 束 是 专门 为 达 
代 器 设计 的 一 个 语法 糖 。for 循 环 可 以 对 针对 数组 切片 、 字 符 串 、 
Range、Vec、 i HashMap、BTreeMap 等 所 有 具有 迭代 器 的 类 
型 执行 循环 ， 而 且 还 允许 我 们 针对 上 自 定 义 类 型 实现 循环 。 








use std::collections::HashMap; 


fn main() 
let v = vec![1,2,3,4,5,6,7,8,9]; 
for i invt{ 
println!("{}", 1); 
} 


let map : HashMap<i32, char> = 
[(1, 'a'), (2, 'b'), (3, 'c')].iter().cloned().collect(); 
for (k, v) in &map { 
println!("{} : 0", k, v); 
} 
} 











那么 for 循 环 是 上 怎么 做 到 这 一 点 的 呢 ? 原因 就 是 下 面 这 个 trait: 





trait IntoIterator { 
type Item; 
type IntoIter: Iterator<Item=Self::Item>; 


fn into_iter(self) -> Self::IntoIter ， 
} 








只 要 某 个 类 型 实现 了 Intolterator， 那 么 调用 into_iter () 方法 就 可 以 
得 到 对 应 的 迭代 器 。 这 个 into_iter 〈) 方法 的 receiver 是 self， 而 不 是 
&self， 执 行 的 是 move 语 义 。 这 么 做 ， 可 以 同时 支持 Item 类 型 为 T、&T 
或 者 &mut T， 用 户 有 选择 的 权力 。 来 看 看 常见 的 容器 是 怎样 实现 这 个 
trait 的 就 明白 了 : 








impl<K, V> IntoIterator for BTreeMap<K，V> { 
type Item = (K, V); 
type IntoIter = IntoIter<K, V>; 


impl<'a, K: 'a, V: 'a> IntoIterator for &'a BTreeMap<K，V> { 
type Item = (&'a K, &'a V); 
type IntoIter = Iter<'a, K, V>; 


impl<'a, K: 'a, V: 'a> IntoIterator for &'a mut BTreeMap<K, V> { 
type Item = (&'a K, &'a mut V); 
type IntoIter = IterMut<'a, K, V>; 

} 





对 于 一 个 容器 类 型 ， 标 准 库 里 面 对 它 impl 了 三 次 Intolterator。 当 Self 
类 型 为 BTreeMap 的 时 候 ，Item 类 型 为 (K，V) ， 这 意味 着 ， 每 次 
next() 方法 都 是 把 内 部 的 元 素 move 出 来 了 ; 当 Self 类 型 为 &BTreeMap 
的 时 候 ，Item 类 型 为 (&K，&V) ， 每 次 next〈) 方法 返回 的 是 借用 ; 
当 Self 类 型 为 &mut BTreeMap 的 时 候 ，Item 类 型 为 (&K，&mutV) ， 
次 next〈) 方法 返回 的 key 是 只 读 的 ，value 是 可 读 写 的 。 


所 以 ， 如 果 有 个 变量 m， 其 类 型 为 BTreeMap， 那 么 用 户 可 以 选择 使 
用 m.into iter () 或 者 (&m) .into iter () 或 者 (&mut 
m) .into_iter() ， 分 别 达到 不 同 的 目的 。 


那么 for 循 环 和 Intolterator trait 究 竟 是 什么 关系 昵 ? 下 面 我 们 写 一 个 
简单 的 for 循 环 示例 : 





fn do_something(e : &i32) 人 


fn main() { 
let array = &[1,2,3,4,5]; 


for i in array { 
do_something(i); 


} 





使 用 以 下 编译 命令 : 





rustc --unpretty=hir -Z unstable-options test.rs 





可 以 看 到 输出 结果 为 : 





#[prelude_import] 

USe std::prelude: :vi::*; 
#[macro_usel] 

extern crate std as std,; 

fn do_something(e: &i32) { } 


fn main() { 
let array = &[1, 2, 3, 4, 5]; 


{ 
let _result = 
match ::std::iter::IntoIterator::into_ iter(array) { 
mut iter => 
loop { 
Jet mut __next,; 
match ::std::iter::Iterator::next(&mut iter) { 
::Std::option: :0ption::Some(val) => 
_ next = val, 
::Std::option::0ption::None => break ， 
let i = next' 
{ do_something(i); } 
}, 
}; 
_resul 
} 





这 说 明 Rust 的 for<item>in<container>{<body>} 语 法 结构 就 是 一 个 语 
法 糖 。 这 个 语法 的 原理 其 实 就 是 调用 <container>.into_iter () 方法 来 获 
得 迭代 器 ， 然 后 不 断 循环 调用 迭代 堪 的 next 〈) 方法 ， 将 返回 值 解 包 ， 
赋值 给 <item>， 然 后 调用 <body> 语 句 块 。 


所 以 在 使 用 for 循 环 的 时 候 ， 我 们 可 以 目 主 选择 三 种 使 用 方式 : 

















// container 在 循环 之 后 生命 周期 就 结束 了 ,循环 过 程 中 的 每 个 item 是 从 container 中 move 出 来 的 
for item in container {} 
// 和 迭代 器 中 只 包含 container 的 & 型 引用 ,循环 过 程 中 的 每 个 item 都 是 container 中 元 素 的 借用 
for item in &container {} 

































































// 和 迭代 器 中 包含 container 的 &mut 型 引用 ,循环 过 程 中 的 每 个 item 都 是 指向 container 中 元 素 的 可 变 借 用 
for item in &mut container {} 





























Rust 的 IntoIterator trait 实 际 上 就 是 for 语 法 的 扩展 接口 。 如 果 我 们 需 
要 让 各 种 上 自 定 义 容 器 也 能 在 for 循 环 中 使 用 ， 那 就 可 以 借鉴 标准 库 中 的 写 
法 ， 目 行 实现 这 个 trait 即 可 。 这 跟 其 他 语言 的 设计 思路 是 一 样 的 。 比 
如 : C# 的 foreach 语 句 也 可 以 对 目 定 义 类 型 使 用 ， 它 的 扩展 接口 就 是 标准 
库 中 定义 的 IEnumerable 接 口 ，Java 的 for 循 环 的 扩展 接口 是 标准 库 中 的 
Iterable 接 口 ，C++ 的 Range-based-for 循 环 也 可 以 使 用 自 定 义 容 器 ， 它 约 
定 的 是 调用 容器 的 begin 〈() /end 〈) 成 员 方法 。 











第 25 音 ”生成 器 


在 Rust 里 面 ， 协 程 〈Coroutine) 是 编写 高 性 能 异步 程序 的 关键 设 
施 ， 生 成 器 〈Generator) 是 协 程 的 基础 。 本 节 主 要 讲解 什么 是 生成 器 ， 
并 简要 介绍 一 下 协 程 。 


25.1 简介 


生成 器 的 语法 很 像 前 面 讲 过 的 闭 包 ， 但 它 与 闭 包 有 一 个 区 别 ， 即 
ee 
一 个 生成 器 。 


依然 用 示例 来 说 话 。 假 设 我 们 要 生成 一 个 Fibonacci 数 列 ， 用 生成 费 
可 以 这 样 写 : 





// 方案 一 
#![feature(generators, generator_trait)] 


use std::ops::{Generator, GeneratorState},; 


fn main() { 
let mut g= || { 
let mut curr : U64 


1; 


let mut next : U64 = 
loop { 
let new next = curr.checked add(next); 


If let Some(new next) = new_next { 
curr = next; 
next = new_next; 
yield curr; // <-- 新 的 关键 字 


} else { 
return; 
} 
}; 
loop { 
unsafe { 
match g.resume() { 
GeneratorState: :Yielded(v) => printin!("{}", v), 
GeneratorState::Complete(_) => return, 
} 
} 
} 





在 这 段 代 码 中 ， 构 造 了 一 个 生成 器 ， 它 长 得 跟 闭 包 的 样子 差不多 ， 
区 别 只 是 它 内 部 用 到 了 yield 关 键 字 。 它 与 dlosure 类 似 的 地 方 在 于 ， 编 译 
器 同样 会 为 它 生 成 一 个 匿名 结构 体 ， 并 实现 一 些 trait， 添 加 一 些 成 员 方 
法 。 跟 closure 不 同 的 地 方 在 于 ， 它 的 成 员 变 量 不 一 样 ， 它 实现 的 trait 也 
不 一 样 。 在 后 面 调 用 它 时 ， 不 是 采用 类 似 闭 包 的 那 种 调用 方式 ， 而 是 使 





用 编译 器 自动 生成 的 成 员 方 法 resume () 。resume () 返回 结果 有 两 种 
可 能 性 : 一 种 是 Yielded 表 示 生 成 器 内 部 yield 关 键 字 返回 出 来 的 东西 ， 此 
时 还 可 以 继续 调用 resume， 还 有 数据 可 以 继续 生成 出 来 ， 男 一 种 是 
Complete 状 态 ， 表 示 这 个 生成 器 已 经 调用 完了 ， 它 的 值 是 内 部 return 关 
键 字 返回 出 来 的 内 容 ， 返 回 了 Complete 之 后 就 不 能 再 继续 调用 resume 
， 人 否则 会 触发 panic。 

生成 器 最 大 的 特点 就 是 ， 程 序 的 执行 流程 可 以 在 生成 融和 调用 者 之 
间 来 回 切 换 。 当 我 们 需要 暂时 从 生成 费 中 返回 的 时 候 ， 束 使 用 yield 关 键 
字 ; 当 调 用 者 希望 再 次 进入 生成 器 的 时 候 ， 束 调用 resume() 方法 ， 这 
时 程序 执行 的 流程 是 从 上 次 yield 返 回 的 那个 点 继续 执行 。 

上 述 程序 的 执行 流程 很 有 意思 ， 它 是 这 样 的 : 


let g=||{..…yield...}; 这 句 话 是 初始 化 了 一 个 局 部 变量 ， 它 是 一 个 生 
成 器 ， 此 时 并 不 执行 生成 器 内 部 的 代码 ; 

:调用 g.resume 〈) 方法 ， 此 时 会 调用 生成 器 内 部 的 代码 ; 

.执行 到 yieldcurr; 这 条 语 时 ，curr 变 量 的 值 为 1， 生 成 器 的 方法 此 时 
会 退出 ，gresume〈) 方法 的 返回 值 是 GeneratorState: : 
Yielded (1) ， 在 main 函 数 中 ， 程 序 会 打印 出 1; 


.循环 调用 g.resume 〈) 方法 ， 此 时 再 次 进入 到 生成 器 内 部 的 代码 

















:此 时 生成 恬 会 直接 从 上 次 退出 的 那个 地 方 继续 执行 ， 跳 转 到 loop 循 
环 的 开头 ， 计 算 curr next new_next 这 几 个 变量 新 的 值 ， 然 后 再 到 yield 


CUIT; 这 条 语句 返回 ; 


:如 此 循环 往复 ， 一 直到 加 法 计算 溢出 ， 生 成 器 调用 了 return; 语 
句 ， 此 时 main 函 数 那 边 会 匹配 上 GeneratorState: : Complete 这 个 分 支 ， 
程序 返回 ， 执 行 完毕 。 


2562 对 化 选 代 全 


生成 器 本 质 上 跟 迭 代 器 是 很 像 的 。 在 Rust 中 ， 和 迭代 器 指 的 是 实现 了 
std: : iter: : Iterator trait 的 类 型 : 





pub trait Iterator { 
type Item; 


fn next(&mut self) -> 0ption<SelLf: :Item>， 








这 个 trait 最 主要 的 一 个 方法 就 是 next 方 法 。 每 次 调用 ， 它 都 会 返回 
下 一 个 元 素 ， 碗 代 完 成 ， 就 返回 None。 使 用 方法 如 下 : 








// 假设 it 是 一 个 迭代 器 变量 

while let Some(item) = it.next() { 
do_something(item); 

} 








next 方 法 接受 的 参数 是 &mut Self 类 型 。 因 为 它 每 次 调用 的 时 候 ， 都 
要 修改 内 部 的 状态 ， 只 有 这 样 ， 下 一 次 调用 的 时 候 才 会 返回 不 同 的 内 
容 。 如 果 内 部 是 指针 ， 需 要 把 指针 指 癌 容器 的 下 一 个 元 素 ; 如果 内 部 是 
索引 ， 束 需要 更 新 索引 的 值 。 

迭代 器 也 可 以 不 指 同 任 何 容器 ， 只 要 它 满 足 Iterator trait 这 个 接口 即 
可 。 比 如 std: : ops: : Range 这 个 类 型 ， 它 代表 一 个 前 闭 后 开 的 区 间 ， 
也 可 以 进行 迭代 ， 只 是 每 次 调用 next 后 它 代 表 的 区 间 束 变 了 。 

任何 一 个 生成 器 ， 总 能 找到 某 种 办 法 改写 为 功能 相同 的 迭代 器 。 还 
是 以 前 面 的 Fibonacci 数 列 为 例 ， 如 果 改 成 迭代 器 的 样子 ， 访 像 下 面 这 样 





// 方案 二 

Struct Fibonacci { 
curr: u64, 
next: u64, 


} 


impl Iterator for Fibonacci { 
type Item = u64; 


fn next(&mut self) -> Option<u64> { 
// 判断 是 否 会 溢出 
let new_next = self.curr.checked add(self.next); 


if let Some(new_ next) = new_next { 
// 先 更 新 内 部 状态 , 再 返回 
self.curr = self.next,; 
self.next = new_next; 
Some(self.curr) 
































} else { 
// 加 法 溢出 ,停止 迭代 
None 

} 


} 


fn fibonacci() -> Fibonacci { 
Fibonacci { curr: 1, next: 1 } 


} 


fn main() { 
let mut it = fibonacci(); 


while let Some(i) = it.next() { 
println!("{}", 1); 





这 有 段 代码 同样 也 能 实现 打印 Fibonacci 数 列 的 功能 。 请 读者 逐 行 未 字 
读 一 下 next 方 法 的 逻辑 ， 看 清楚 它 是 如 何 记 录 状 态 的 ， 理 解 为 什么 每 次 
调用 next 方 法 都 会 返回 不 同 的 值 。 这 个 示例 在 后 文 还 会 继续 使 用 。 








友 代 器 模式 是 一 种 典型 的 “ 拉 ? 模 式 ， 它 也 经 党 被 称 为 “惰性 求 
值 ”(lazy evaluation) 。 生 成 器 在 这 一 点 上 与 迭代 器 是 一 样 的 ， 也 需要 
使 用 者 调用 方法 把 数据 拉 出 来 。 它 们 一 个 用 的 是 next 方 法 ， 一 个 用 的 是 
resume 方 法 ， 虽 然 方法 的 签名 有 所 不 同 ， 但 使 用 上 差不多 。 





25.3 对比 立即 求 值 


实际 上 ， 从 代码 组 织 多 辑 上 来 说 ， 友 代 喜 模式 已 经 是 相对 高 阶 一 
对 于 一 个 刚刚 接触 编程 的 初学 者 来 说 ， 用 下 面 这 种 写法 才 是 
常见 的 : 








// 方案 三 
fn collector() -> Vec<u64> { 
let mut res = vec![]; 
let mut curr : U64 = 1; 
let mut next : U64 = 1; 
loop { 
let new next = curr.checked add(next); 


if let Some(new_ next) = new_next { 
curr = next; 
next = new_next,; 
res.push(curr); 

} else { 
break; 

} 


return res; 


} 


fn main() { 
let collected = collector(); 
let mut it = collected.iter(); 
while let Some(1i) = = it.next() { 
println!("{}", i); 
} 
} 








在 这 个 方案 中 ， 我 们 用 一 个 循环 把 Fibonacci 数 列 提 前 生成 出 来 了 ， 
存储 在 一 个 动态 数组 里 ， 然 后 再 去 使 用 。 这 种 做 法 可 以 看 作 是 惰性 求 值 
的 反 向 操作 ， 叫 作 * 立 即 求 值 ” (eager evaluation) 。 不 过 ， 它 有 性 能 上 
的 人 缺点， 方案 三 提前 把 数据 收集 起 来 ， 缺少 了 灵活 性 。 如 果 使 用 者 只 需 
要 使 用 这 个 序列 的 前 10 个 数据 呢 ? 如 果 是 方案 二 欠 代 堪 的 那 种 写法 ， 使 
用 者 可 以 选择 遍历 10 个 元 素 后 束 提 前 break; 后 面 的 数据 既 不 需要 生 
产 ， 也 不 需要 消 纤 ,还 节省 了 一 个 临时 的 占用 很 大 内 存 空间 的 容器 ， 这 
就 是 “惰性 求 值 ?的 好 处 。 如 果 我 们 把 方案 三 改 成 方案 二 迭代 器 的 写法 ， 
性 能 和 灵活 性 更 佳 ， 但 是 需要 人 工 推理 : 哪些 数据 是 需要 存储 在 欠 代 器 
成 员 中 的 ， 哪 些 是 不 需要 的 ， 0 次 的 状态 
退出 next 方 法 时 如 何 保存 这 一 次 的 状态 这 些 都 是 "心智 负担 ”。 业务 

















逻辑 越 复杂 ， 这 个 负担 越 严 重 。 


25.4 生成 器 的 原理 
25.4.1 生成 器 原理 简介 


再 回 过 头 来 看 一 下 生成 器 。 它 实际 上 是 达 代 器 和 立即 求 值 的 “ 杂 
区 ”。 一 方面 ， 它 写 起 来 更 接近 人 的 思维 模型 ， 代 码 流程 清晰 ， 人 逻辑 上 
更 符合 直觉 ， 男 一 方面 ， 它 在 执行 的 时 候 又 具备 惰性 求 值 的 性 能 优势 。 
那么 编译 器 是 如 何 实现 生成 器 的 呢 ? yield 关 键 字 在 背后 究竟 做 了 什么 ? 


一 句 话 总 结 ， 就 是 编译 器 把 生成 器 上 自动 转换 成 了 一 个 匿名 类 型 ， 然 
后 对 这 个 类 型 实现 了 Generator 这 个 trait。 这 种 处 理 手 法 和 闭 包 非常 相 
似 。 和 闭 包 一 样 ， 生 成 器 也 可 以 捕获 当前 环境 中 的 局 部 变量 ， 并 且 可 以 
用 move 做 修饰 ， 捕 获 的 环境 变量 都 是 当前 生成 器 的 成 员 ， 捕 获 规则 也 
与 闭 包 一 样 。Generator trait 是 这 么 定义 的 : 























trait Generator { 
type Yield; 
type Return,; 
// 至 少 到 目前 为 止 , resume 方 法 还 不 能 接受 额外 参数 , 这 个 限制 条 件 以 后 可 能 会 放宽 
// 目前 的 resume 方 法 还 是 不 稳定 版 本 , 以 后 应 该 会 去 掉 unsafe, self 的 类 型 也 会 有 所 变化 ， 
// 具体 参见 下 一 节 的 自 引 用 类 娃 
unsafe fn resume(&mut self) -> GeneratorState<Self::Yield, Self::Return>,; 













































































但 是 ， 生 成 右 内 部 还 有 额外 的 成 员 ， 那 就 是 跨 yield 语 句 存 在 的 局 部 

变量 ， 也 都 会 当成 成 员 变 量 。 这 是 因为 ， 生 成 器 内 部 的 语句 会 成 为 成 员 
函数 resume 〈) 的 方法 体 ， 源 代码 中 的 yield 语 句 都 被 蔡 换 成 了 普通 的 
retum 语 句 ， 且 返回 的 是 Generator-State: : Yielded ( ) 。 源 代码 中 的 
retum 语 句 依然 是 return 语 句 ， 但 返回 的 是 GeneratorState: : 
Complete (_) 。 注 意 生 成 器 有 一 个 特点 ， 融 是 每 次 yield 退 出 之 后 ， 当 
前 的 局 部 变量 会 保持 当前 的 值 不 变 ， 下 一 次 被 调用 resume 再 进来 执行 的 
时 候 ， 会 继续 从 上 次 yield 的 那个 地 方 继续 执行 ， 局 部 变量 是 无 顷 再 次 初 
始 化 的 。 这 就 意味 着 ， 对 于 在 yield 前 和 yield 后 都 出 现 过 的 局 部 变量 ， 务 
必要 保存 它 的 状态 ， 它 的 值 要 存 到 匿名 类 型 的 成 员 中 。 


我 们 再 看 看 最 开始 那 段 示例 : 
































let mut g= || { 
Jet mut curr : U64 
Jet mut next : U64 
loop { 
let new_next = curr.checked_add(next); // 下 轮 循环 的 时 候 要 继续 使 用 curr next 的 人 


1; 
1; 


























If let Some(new _ next) = new_next { 
curr = next; 
next = new_next,; 
yield curr; // <-- 此 处 退出 
} else { 
return; 





}; 





可 以 看 到 ， 再 进入 生成 器 的 时 候 ， 局 部 变量 curr next 的 值 是 马上 就 
需要 使 用 的 ， 因此 变量 g 里 面 无 论 如 何者 故 给 这 两 个 变量 留 下 位 置 ， 保 
存 它 们 的 值 。 和 否则， 下 次 再 调用 resume 方 法 的 时 候 ， 它 们 就 无 法 恢复 到 
上 次 退出 时 的 状态 了 。 而 另外 一 个 局 部 变量 new_next 则 无 须 保 存 ， 因 为 
它 没 有 路 yield 存 在 ， 所 以 这 个 局 部 变量 可 以 作为 成 员 方 法 resume 内 部 的 
局 部 变量 ， 无 须 提升 为 g 的 局 部 变量 。 


编译 器 把 这 个 生成 缮 处 理 之 后 ， 逻 辑 如 下 : 
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了 
// 与 真实 的 编译 器 转换 后 的 代码 并 不 一 臻 

// 编译 器 是 如 何 做 这 个 转换 的 ， PR librustc mir/transform/generator.rs 
// 前 编译 器 实际 上 是 转换 为 "struct, 此 处 使 用 enum 是 为 了 更 方便 地 演示 大 概 的 逻辑 


#![feature(generators, generator_trait)] 






























































use std::ops::{Generator, GeneratorState},; 


fn main() { 
let mut g={ 
enum __ AnonymousGenerator { 
Start{curr : u64, next : u64}, 
Yieldi{curr : u64, next : u64}, 
Done, 


} 


impl Generator for _ AnonymousGenerator { 
type Yield = u64; 
type Return = (); 


unsafe fn resume(&mut self) -> GeneratorState<Self::Yield, Self::Return: 


use std::mem; 
match mem::replace(self, _ AnonymousGenerator::Done) { 
_ AnonymousGenerator::Start{curr, next} 
| _ AnonymousGenerator::Yieldi{curr, next} => { 
let new_next = curr.checked add(next); 


if let Some(new next) = new_next { 


*self = AnonymousGenerator::Yieldi{curr: next, next: r 
return GeneratorState::Yielded(curr); 

} else { 
*self = __AnonymousGenerator: :Done; 


return GeneratorState: :Complete(()); 
} 
} 


_ AnonymousGenerator::Done => { 
panic!("generator resumed after completion") 


} 
} 
} 
} 
_ AnonymousGenerator::Start{ curr: 1, next: 1} 
}; 
loop { 
unsafe { 
match g.resume() { 
GeneratorState: :Yielded(v) => printin!("{}", Vv), 
GeneratorState::Complete(_) => return, 
} 
} 
} 





可 以 看 到 ， 转 换 后 的 代码 实际 上 和 和 从 代 器 非常 相似 。 所 以 ， 生 成 器 
实际 上 是 让 编译 器 帮 我 们 目 动 管理 状态 : 哪些 状态 应 该 放 到 成 员 变 量 里 
面 ， 哪 些 不 需要 ; 退出 前 如 何 保存 状态 ， 重 新 进入 的 时 候 如 何 读 取 上 次 
的 状态 等 ， 都 是 编译 器 帮 我 们 目 动 做 好 了 的 。 


如 果 生 成 器 内 部 存在 多 个 yield 语 句 呢 ? 比如 下 面 这 样 : 








let mut g= || { 
yield 1 i32; 
yield 2_i32; 
yield 3_i32; 
return 4_i32; 


}; 





那 我 们 束 再 引入 一 个 状态 ， 来 表达 上 次 已 经 执行 到 哪 条 语句 了 ， 下 
次 调用 应 该 从 哪 条 语句 开始 执行 。 在 进入 resume 方 法 的 时 候 ， 先 判断 这 
个 状态 ， 然 后 再 跳 转 即 可 。 





Jet mut g = { 
struct _ AnonymousGenerator { 


State: U32 


impl Generator for _ AnonymousGenerator { 
type Yield = i32; 
type Return = i32; 


unsafe fn resume(&mut self) -> GeneratorState<Self::Yield, Self::Return> { 
match Self.state { 
9 => { // 从 初始 状态 开始 执行 
Self.state = 1; 
return GeneratorState: :Yielded(1); 








[my 


=> { // 上 一 次 返回 的 是 yield 1 
self.state = 2; 
return GeneratorState: :Yielded(2); 














Dh 


=> { // 上 一 次 返回 的 是 yield 2 
self.state = 3; 
return GeneratorState: :Yielded(3); 














CD 


=> { // 上 一 次 返回 的 是 yield 3 
self.state = 4; 
return GeneratorState: :Complete(4); 




















=> { // 上 一 次 返回 的 是 return 4 
panic!("generator resumed after completion") 





} 
} 
} 


_ AnonymousGenerator{f state: 0} 


}; 





总 之 ， 任 何 一 个 生成 器 ， 总 能 找到 办 法 将 它 目 动 转 换 为 类 似 迭 代 器 
的 样子 。 之 所 以 说 是 类 似 ， 是 因为 生成 器 的 功能 更 强大 ， 它 的 
resume 〈) 方法 实际 上 可 以 设计 为 携带 更 多 的 参数 ， 只 是 目前 的 Rust 还 
没有 实现 ， 这 个 需求 并 不 是 很 紧急 而 已 。 


25.4.2 ” 目 引 用 类 型 
目前 的 生成 器 只 是 一 个 在 nightly 版 本 中 存在 的 、 实 验 性 质 的 功能 ， 


它 还 有 一 些 问题 没有 解决 。 最 主要 的 一 个 问题 是 如 何 使 得 借用 跨 yield 存 
在 。 示 例如 下 : 





#![feature(generators, generator_trait)] 


fn main() { 
let -g = || { 
let local = 1; 
let ptr = &local; 
yield local,; 
yield *ptr; 
}; 
} 





编译 ， 出 现 编译 错误 : 





error[E0626]: borrow may still be in use when generator yields 








这 个 错误 究竟 是 什么 意思 呢 ? 我 们 可 以 通过 分 析 生 成 器 的 原理 来 理 
解 这 个 错误 的 含义 。 可 以 尝试 看 看 这 个 生成 器 剥 掉 语法 糖 之 后 的 样子 。 
注意 到 ， 第 一 个 yield 之 后 变量 ptr 依 然 被 使 用 ， 且 local 这 个 变量 也 还 存 
在 ， 那 么 意味 着 我 们 要 在 生成 的 匿名 类 型 的 成 员 中 ， 保 存 ptr 和 local 这 两 
个 变量 。 再 加 上 一 个 成 员 变 量 记 录 yield 的 位 置信 息 ， 我 们 可 以 设计 下 面 
这 样 的 匿名 结构 体 : 








Struct _ Generator_ _ 
local: i32, 
ptr: &i32, 
state: u32, 

} 








针对 这 个 类 型 实现 Generator 这 个 trait， 基 本 上 就 等 同 于 上 面 那 段 程 
序 剥 掉 语 法 糖 之 后 的 效果 。 


现在 就 可 以 更 清楚 地 看 到 具体 问题 在 哪里 了 。 这 里 的 关键 点 是 : 一 
个 结构 体 类 型 内 部 出 现 了 一 个 成 员 引 用 另外 一 个 成 员 的 现象 。 这 种 类 型 
被 称 为 “ 自 引 用 类 型 ”(Self-Referential Type) 。 目 前 的 Rust， 对 自 引 用 
类 型 有 很 多 限制 。 因 为 这 个 类 型 会 破坏 Rust 的 一 个 基本 假设 : 任何 类 型 
都 是 可 移动 的 。 这 个 假设 让 Rust 的 移动 语义 变 得 非常 清晰 简单 (主要 跟 
C++ 对 比 ，》。 但 是 自 引 用 类 型 在 移动 的 时 候 会 出 问题 。 原 本 成 员 ptr 是 指 
回 成 员 变 量 local 的 ， 如 果 这 个 结构 体 整 体 发 生 了 移动 ，ptr 指 针 的 值 保 持 
不 变 ，local 的 位 置 却 发 生 了 变化 ， 那 么 就 会 制造 出 悬空 指针 。 上 所 以 ， 目 
前 的 Rust 是 不 允许 这 种 情况 出 现 的 ， 这 种 代码 会 被 生命 周期 检查 禁止 
擅 。 这 就 是 上 面 那 段 示 例 代 码 无 法 编译 通过 的 深层 原因 。 

















但 是 目 引用 现象 未 必 就 一 定 不 安全 。 假 如 构成 目 引 用 之 后 这 个 对 象 
就 永远 不 再 移动 ， 那 么 它 其 实 是 没 问 题 的 ， 也 不 会 悬空 指针 之 类 的 情 
况 出 现 。 在 写生 成 器 的 时 候 会 很 容易 出 现 自 引用 对 象 ， 如 末 完 全 茶 止 这 
种 行为 ， 会 非常 影响 用 户 体验 。 如 何 让 用 户 有 权 创 建 目 引用 的 生成 器 ， 
同时 又 能 避免 安全 性 问题 呢 ? Rust 设 计 组 通过 巧妙 的 设计 做 到 了 这 一 
点 。 主 要 想法 是 : 


.应 该 允许 用 户 创建 和 目 引用 生成 器 ， 因 为 在 调用 resume 方 法 之 前 的 
移动 都 是 没 问题 的 ， 毕 竟 这 个 时 候 它 内 部 的 许多 成 员 都 是 未 初始 化 状 








一 旦 resume 被 调用 过 了 ， 以 后 束 不 能 再 移动 这 个 对 象 了 ， 因 为 这 
0 的 对 象 很 可 能 已 经 初始 化 好 了 ， 再 发 生 移动 就 会 造成 
TA 


具体 来 说 ， 设 计 组 会 做 以 下 改变 。 

标准 库 引 入 一 个 新 的 智能 指针 类 型 PinMut<"a，T>， 它 可 以 指向 一 
个 T 类 型 的 对 象 。 它 的 作用 是 ， 当 这 个 指针 存在 的 时 候 ， 它 所 指 癌 的 对 
象 是 不 可 移动 的 。 


.允许 更 多 的 智能 指针 类 型 作为 self 变 量 的 类 型 ， 这 样 我 们 可 以 指定 
resume 方 法 的 第 一 个 参数 是 self: PinMut<Self> 类 型 ， 而 不 是 &mut self 





这 样 ， 就 可 以 从 逻辑 上 保证 用 户 调用 resume 方 法 之 前 ， 一 定 先 构造 
出 一 个 PinMut<XXGenerator> 的 指针 变量 。 这 样 ， 在 这 个 变量 存在 的 期 
间 ， 生 成 器 就 无 法 移动 ， 调 用 resume 必 须 通 过 这 个 指针 来 完成 。 有 了 这 
个 保证 ，resume 方 法 前 面 的 unsafe 修 饰 也 就 可 以 去 挥 了 。 预 计 这 个 设计 
到 2018 年 下 半年 就 可 以 稳定 下 来 。 


另外 ， 生 成 器 本 身 并 不 是 直接 面向 广大 用 户 的 接口 。 用 户 真正 需要 
的 是 完成 异步 任务 。 实 际 上 ,“ 协 程 " 才 是 最 终 用 户 用 得 最 多 的 东西 。 生 
成 器 只 是 实现 协 程 的 一 个 底层 工具 。 最 终 ， 协 程 库 会 把 所 有 这 些 PinMut 
# 针 之 类 的 事情 封装 管理 起 来 。 

















25.5” 协 程 简介 


Rnust 设 计 这 个 生成 器 ， 主 要 目的 在 于 ， 基 于 生成 器 设计 一 套 协 程 
CCoroutine) 的 方案 ， 从 而 方便 编写 大 规模 高 性 能 异步 程序 。 这 个 功能 
也 是 Rust 设 计 组 2018 年 要 解决 的 主要 问题 之 一 ， 预 计 要 到 2018 年 年 底 才 
能 正式 稳定 下 来 。 到 目前 为 止 ， 依 然 只 是 一 个 实验 性 质 的 不 稳定 功能 。 


所 谓 协 程 ， 指 的 是 一 种 用 户 态 的 非 抢占 式 的 多 任务 机 制 。 它 也 可 以 
实现 多 任务 并 行 。 跟 线程 相 比 ， 它 的 最 大 特点 是 它 不 是 被 内 核 调 度 的 ， 
而 是 由 任务 自己 进行 协作 式 的 调度 。 协 程 的 实现 方案 一 般 可 以 分 为 
stackful 以 及 stackless 两 种 。Rust 的 协 程 采用 的 是 stackless coroutine 的 设计 
思路 。 


在 Rust 语 言 和 标准 库 中 ， 只 引入 了 极 少 数 的 关键 字 、trait 和 类 型 。 
async 和 await 关 键 字 是 目前 许多 语言 都 采用 的 主流 方案 ， 使 用 关键 字 而 
不 是 用 宏 来 做 API， 有 助 于 社区 的 统一 性 ， 避 免 不 同 的 异步 方案 使 用 完 
全 不 一 样 的 用 户 API。 引 入 关键 字 使 用 的 是 edition 方 案 ， 所 以 不 会 造成 
代码 不 兼容 问题 。 标 准 库 中 只 有 极 少 数 必 须 的 类 型 ， 这 也 是 Rust 一 贯 的 
设计 思路 。 但 凡是 可 以 在 第 三 方 库 中 实现 的 ， 一 律 在 第 三 方 库 中 实现 ， 
哪怕 这 个 库 本 来 就 是 官方 核心 组 维护 的 ， 这 样 做 可 以 让 这 个 库 的 版 本 升 
级 更 灵活 ， 有 助 于 标准 库 的 稳定 性 。 


Rust 的 协 程 设计 ， 核 心 是 async 和 await 两 个 关键 字 ， 以 及 Future 这 个 
trait: 
































pub trait Future { 
type Output,; 
fn poll(self: PinMut<Self>, cx: &mut Context) -> Poll<Self::0Output>; 





Future 这 个 trait 代 表 的 是 异步 执行 。 它 里 面 最 重要 的 一 个 方法 是 
poll， 意 思 是 ， 碍 看 当前 Future 的 状态 ， 这 个 方法 的 返回 类 型 如 下 : 








pub enum Poll<T> { 
Ready(T)， 
Pending, 





对 于 一 个 实现 了 Future Trait 的 类 型 ， 每 次 调用 这 个 poll 方 法 ， 其 实 
就 是 查看 一 下 这 个 对 象 当 前 的 状态 是 什么 ， 该 状态 可 以 为 正在 执行 或 者 
已经 执行 完毕 。 


Future 可 以 组 合 ， 一 个 Future 可 以 由 其 他 的 一 个 或 者 多 个 Future 包 装 
而 成 。 跟 我 们 已 经 见 过 的 迭代 器 Iterator 很 像 。 比 如 ， 我 们 可 以 实现 一 个 
新 的 Future， 它 的 结果 是 多 个 Future 按 顺序 执行 得 到 的 。 或 者 ， 实 现 一 
个 Future， 它 的 结果 是 两 个 子 Future 中 先 返 回 的 那个 。Future 组 合 的 方式 
可 以 非常 灵活 。 


然后 我 们 还 需要 一 个 调度 器 Executor， 标 准 库 中 有 一 个 Executor 的 
trait。 它 的 具体 实现 可 以 由 第 三 方 库 来 实现 。 它 应 该 有 一 个 主事 件 循 
环 ， 不 断 调 用 最 外 层 每 个 收 到 了 事件 通知 的 Future 的 poll 方 法 ， 外 层 的 
Future 的 pol] 方 法 被 调用 时 ， 它 就 会 调用 内 层 Future 的 pol] 方 法 ， 不 断 蔡 
套 。 如 果 这 个 Future 处 于 Pending 状 态 ， 那 么 这 个 Future 束 应 该 设置 好 自 
己 需 要 监听 的 事件 信息 ， 然 后 马上 返回 ， 放 弃 占 用 CPU。 等 到 合适 的 事 
件 发 生 时 ， 调 上 度 器 则 应 该 再 次 调用 这 个 Future 的 poll 方 法 ， 驱 动 这 个 
Future 从 上 次 退出 的 那里 继续 往 下 执行 。 


大 家 可 以 看 到 ，Future 跟 Generator 一 样 ， 具 备 同样 的 特性 ， 也 就 是 
说 可 以 在 某 个 地 方 主动 中 断 执 行 ， 待 下 一 次 再 进来 的 时 候 ， 刚 好 可 以 从 
上 次 退出 的 地 方 恢 复 执行 。 这 就 是 为 什么 Rust 的 Future 最 终 是 基于 
Generator 实 现 的 。 在 Rust 里 面 ，Generator 是 Future 的 基础 设施 。 


关于 这 个 Future trait， 男 外 一 个 需要 注意 的 点 是 ， 它 的 self 参 数 是 
PinMut<Self> 类 型 ， 而 Generator 的 resume 方 法 的 self 参 数 是 &mut Self 类 
型 。 这 个 PinMut 类 型 ， 也 是 一 个 智能 指针 ， 它 的 目的 主要 就 是 保证 它 所 
指向 的 对 象 无 法 被 move。 而 &mut Self 类 型 是 无 法 保证 这 一 点 的 。 举 个 
例子 ， 大 家 还 记得 std: : mem: : swap 方 法 吗 ? 








pub fn swap<T>(x: &mut T, y: &mut T) 





对 于 任意 两 个 T 类 型 的 对 象 ， 如 果 我 们 拥有 指 癌 它们 的 &mut T 型 指 
针 ， 就 可 以 把 它们 互 换 位 置 。 这 个 操作 就 相当 于 把 这 两 个 对 象 都 move 
到 了 其 他 地 方 。 如 果 这 两 个 对 象 存在 自 引 用 的 现象 ， 那 么 这 个 swap 操 作 





就 可 以 造成 它们 内 部 出 现 野 指 针 。 而 PinMut<T> 类 型 就 不 存在 这 样 的 问 
题 。PinMut<T> 还 实现 了 DerefMut trait， 所 以 它 依然 有 权 调用 那些 需要 
&mut Self 的 成 员 方法 。 正 因为 PinMut 保 证 了 指向 的 对 象 不 可 move， 所 
以 这 个 poll 方 法 就 可 以 不 用 unsafe 修 饰 了 。 


一 般 情况 下 ， 实 现任 务 调度 以 及 为 通过 各 种 异步 操作 实现 Future 
trait 并 不 是 最 终 用 户 关 注 的 问题 ， 这 些 应 该 都 已 经 被 网 络 开 发 框架 完 
成 ， 比 如 tokio。 大 部 分 用 户 需 要 关注 的 是 如 何 利 用 这 些 框架 完成 业务 多 
辑 。 用 户 此 时 用 得 最 多 的 是 async 和 await 关 键 字 。 在 最 新 的 nightly 版 本 
中 ， 只 有 async 关 键 字 的 实现 已 完成 ，await 关 键 字 还 存在 争议 ， 它 目前 
依然 是 使 用 宏 来 实现 的 。 一 个 基本 的 使 用 示例 如 下 所 示 : 





async fn async_fn(x: U8) -> U8 { 
let msg = await!(read from network()); 
Jet result = await!(calculate(msg, x)); 
result 





在 这 个 示例 中 ， 假 设 read_from_network () 以 及 calculate () 函数 
都 是 异步 的 。 最 外 层 的 async_ fm 函数 当然 也 是 异步 的 。 当 代码 执行 到 
await! 《〈read_from_network () ) 里 面 的 时 候 ， 发 现 异 步 操作 还 没有 完 
成 ， 它 会 直接 退出 当前 这 个 函数 ， 把 CPU 让 给 其 他 任务 执行 。 当 这 个 数 
据 从 网 络 上 传输 完成 了 ， 调 度 堪 会 再 次 调用 这 个 函数 ， 它 会 从 上 次 中 断 
的 地 方 恢 复 执行 。 所 以 用 asyncawait 的 语法 写 代 码 ， 异 步 代 码 的 逻辑 在 
源码 组 织 上 跟 同 步 代 码 的 逻辑 差别 并 不 大 。 这 里 面 状 态 保存 和 恢复 这 些 
琐碎 的 事情 ， 都 由 编译 堪 帮 我 们 完成 了 。 


下 面 给 大 家 解释 一 下 async 和 await 分 别 做 了 什么 事情 。 
async 关 键 字 可 以 修饰 函数 、 闭 包 以 及 代码 块 。 对 于 函数 : 











async fn fi(arg: u8) -> u8 全 





实际 上 等 同 于 : 





fn fi(arg: u8) -> impl Future<Output = U8> {} 





这 两 种 写法 实际 上 是 一 模 一 样 的 。 几 是 被 async 修 饰 的 函数 ， 返 回 
的 都 是 一 个 实现 了 Future trait 的 类 型 。 由 async 修 饰 的 财 包 也 是 一 样 的 。 
async 代 码 块 同样 类 似 。 它 相当 于 创建 了 一 个 语句 块 表达 式 ， 这 个 表达 
式 的 返回 类 型 是 impl Future。async 关 键 字 不 仅 对 函数 签名 做 了 一 个 改 
变 ， 而 且 对 函数 体 也 目 动 做 了 一 个 包装 ， 被 async 关 键 字 包 起 来 的 部 
分 ， 会 自动 产生 一 个 Generator， 并 把 这 个 Generator 包 装 成 一 个 满足 
future 约束 的 结构 体 。 在 函数 体 中 用 户 需 要 返回 的 是 Future: : Output 类 
型 。 














对 于 await 这 个 宏 ， 我 们 可 以 在 标准 库 中 看 到 它 的 实现 : 





macro_rules! await { 
($e:expr) => { { 
let mut pinned = $e; 
let mut pinned = unsafe { $crate: :mem::PinMut: :new unchecked(&mut pinned) },; 
loop { 
match $crate::future::poll in task cx(&mut pinned) { 
$crate: :task::Poll::Pending => yield, 
$crate::task::Poll::Ready(x) => break x, 


} } 





从 语法 上 来 讲 ，await 一 定 只 能 在 async 函 数 或 代码 块 中 出 现 ， 所 以 
它 实 际 上 是 被 包 在 一 个 Generator 里 面 的 。await 这 个 宏 的 逻辑 也 很 简单 ， 
await ! The future) 所 做 的 事情 就 是 ， 先 构造 一 个 PinMut 指 针 指 回 
another_future， 然 后 调用 another_future 的 poll 方 法 。 如 果 其 处 于 Pending 
状态 则 yield， 暂时 退出 这 个 Future。 每 当 调 度 器 恢复 它 的 执行 时 ， 它 都 
会 继 乡 衬 调 用 poll 方 法 ， 直 到 处 于 Ready 状 态 ， 这 时 候 这 个 await 就 算是 执 
行 完 毕 了 ， 继 续 执 行 后 面 的 语句 。 


“下 面 我 们 看 一 下 ， 如 有 果 基 于 async/await 写 程序 ， 看 起 来 会 是 什么 样 














async fn fetch_rust_lang(client: hyper::Client) -> io::Result<String> { 
let response = await!(client.get("https://www.rust-lang.org"))?; 
If !Iresponse.status().is success() { 
return Err(io::Error::new(io::ErrorKind::0ther, "request failed")) 


let body = await!(response.body().concat())?; 
let string = String::from utf8(body)?; 
Ok(string) 


可 以 看 到 ， 使 用 async/await 来 号 异步 逻辑 ， 一 方面 可 以 保证 高 效 
率 ， 另 一 方面 ， 代 码 流程 还 是 跟 普 通 的 同步 逻辑 类 似 ， 比 较 符 合 直觉。 
当然 ， 我 们 也 可 以 不 用 这 个 语法 ， 通 过 Future 的 各 种 adapter 的 组 合 来 完 
成 同样 的 功能 ， 这 就 跟 上 文中 的 对 比 一 样 ， 其 与 async/await 的 区 别 ， 就 
与 手写 Iterator 和 Generator 之 间 的 区 别 一 样 。 


第 26 音 ”标准 库 简 介 


除了 前 面 介 绍 过 的 容器 、 友 代 需 之 外 ， 标 准 库 还 提供 了 一 系列 有 用 
的 类 型 、 函 数 、trait 等 。 本 章 挑 选 其 中 比较 和 常见 的 一 部 分 简单 介绍 。 


26.1 类 型 转换 


Rust 给 我 们 提供 了 一 个 关键 字 as 用 于 基本 类 型 的 转换 。 但 是 除了 基 
本 类 型 之 外 ， 还 有 更 多 的 自 定义 类 型 ， 它 们 之 间 也 经 常 需要 做 类 型 转 
换 。 为 此 ，Rust 标 准 库 给 我 们 提供 了 一 系列 的 trait 来 辅助 抽象 。 





26.1.1 AsRef/AsMut 





AsRef 这 个 trait 代 表 的 意思 是 ， 这 个 类 型 可 以 通过 调用 as_ref 方 法 ， 
得 到 另外 一 个 类 型 的 共享 引用 。 它 的 定义 如 下 : 





pub trait AsRef<T: ?Sized> { 
fn as_ref(&self) -> &T; 
} 





同 理 ，AsMut 有 一 个 as_mut 方 法 ， 可 以 得 到 另外 一 个 类 型 的 可 读 写 
引用 : 





pub trait AsMut<T: ?Sized> { 
fn as mut(&mut self) -> &mut T; 
} 





比如 说 ， 标 准 库 里 面 的 String 类 型 ， 束 针对 好 几 个 类 型 参数 实现 了 
ASsRef trait: 





impl AsRef<str> for String 
impl AsRef<[u8]> for String 
impl AsRef<OsStr> for String 
impl AsRef<Path> for String 





AsRef 这 样 的 trait 很 适合 用 在 泛 型 代码 中 ， 为 一 系列 类 型 做 统一 抽 
象 。 比 如 ， 我 们 可 以 写 一 个 泛 型 函数 ， 它 接受 各 种 类 型 ， 只 要 可 以 被 转 
换 为 &[u8] 即 可 : 





fn iter_bytes<T: AsRef<[u8]>>(arg: T) { 


for i in arg.as_ref() { 
println!("{}", 1); 


} 


fn main() { 

let s: String = String::from("this is a string"); 
let v: Vec<u8> = vec![1,2,3]; 
let c: &str = "hello"; 

// 相当 于 函数 重 载 。 只 不 过 基于 泛 型 实现 的 重 载 , 一定 需要 重 载 的 参数 类 型 满足 某 种 共同 的 约束 
iter_bytes(s); 
iter_bytes(v); 
iter_bytes(c); 


















































26.1.2 Borrow/BorrowMut 


Borrow 这 个 trait 设 计 得 与 AsRef 非 常 像 。 它 是 这 样 定义 的 : 





pub trait Borrow<Borrowed: ?Sized> { 
fn borrow(&self) -> &Borrowed; 
} 





可 以 说 ， 除 了 名 字 之 外 ， 它 和 AsRef 长 得 一 模 一 样 。 但 它们 的 设计 
意图 不 同 。 比 如 ， 针 对 String 类 型 ， 它 只 实现 了 一 个 Borrow<str>: 





impl Borrow<str> for String 





这 是 因为 这 个 trait 一 般 被 用 于 实现 某 些 重要 的 数据 结构 ， 比 如 
HashMap: 





impl HashMap { 
pub fn get<Q: ?Sized>(&self, k: &Q) -> Option<&V> 
where K: Borrow<Q>, 
Q: Hash + Eq 
{} 





和 BTreeMap: 





impl BTreeMap { 
pub fn get<Q: ?Sized>(&self, key: &Q) -> Option<&V> 


where K: Borrow<Q>, 
Q: Ord 
{} 





所 以 ， 它 要 求 borrow() 方法 返回 的 类 型 ， 必 须 和 原来 的 类 型 具备 
同样 的 hash 值 ， 以 及 排序 。 这 是 一 个 约定 ， 如 果实 现 Borrow trait 的 时 候 
违反 了 这 个 约定 ， 那 么 把 这 个 类 型 放 到 HashMap 或 者 BTreeMap 里 面 的 
时 候 就 可 能 出 现 问 题 。 


26.1.3 From/Into 


ASsRef/Borrow 做 的 类 型 转换 都 是 从 一 种 引用 &T 到 另 一 种 引用 &U 的 
转换 。 而 Fromy/Into 做 的 则 是 从 任意 类 型 T 到 U 的 类 型 转换 : 





pub trait From<T> { 
fn from(T) -> Self， 
} 


pub trait Into<T> { 
fn into(self) -> T,; 
} 





显然 ，From 和 Into 是 互 逆 的 一 组 转换 。 如 果 T 实 现 了 From<U>， 那 
么 U 理 应 实现 Into<T>。 因 此 ， 标 准 库 里 面 提供 了 这 样 一 个 实现 : 





impl<T, U> Into<U> for T where U: From<T> 


fn into(self) -> Ut 
U::from(self) 
} 


} 





用 上 自然 语言 描述 ， 意 思 就 是 : 如 果 存 在 U: From<T>， 则 实现 T: 
Into<U>。 


正 是 因为 标准 库 中 已 经 有 了 这 样 一 个 默认 实现 ， 我 们 在 需要 给 两 个 


类 型 实现 类 型 转换 的 trait 的 时 候 ， 写 一 个 From 就 够 了 ，Into 不 需要 自己 
手写 。 





比如 ， 标 准 库 里 面 己 经 给 我 们 提供 了 这 样 的 转换 : 





impl<'a> From<&'a str> for String 





这 意味 着 &str 类 型 可 以 转换 为 String 类 型 。 我 们 有 两 种 调用 方式 : 
一 种 是 通过 String: : from (&str) 来 使 用 ， 一 种 是 通过 &str: : 
into 〈) 来 使 用 。 它 们 的 意思 一 样 : 








fn main() { 

Jet s: &'static str = "hello"; 

let stri: String = s.into(); 

let str2: String = String::from(s); 
} 





另外 ， 由 于 这 几 个 trait 很 党 用， 因此 Rust 已 经 将 它们 加 入 到 prelude 
中 。 在 使 用 的 时 候 我 们 不 需要 写 use std: : convert: : From; 这 样 的 语 
名 了 ， 包 括 AsRef、AsMut、Into、From、ToOwned 等 。 具 体 可 以 参见 
libstd/prelude/v1.rs 源 代码 的 内 容 。 


标准 库 中 还 有 一 组 对 应 的 TryFrom/TryInto 两 个 trait， 它 们 是 为 了 处 


理 那 种 类 型 转换 过 程 中 可 能 发 生 转 换 错 误 的 情况 。 因 此 ， 它 们 的 方法 的 
返回 类 型 是 Result 类 型 。 


26.1.4 ToOwned 


ToOwned trait 提 供 的 是 一 种 更 “ 泛 化 ”的 Clone 的 功能 。Clone 一 般 是 
从 &T 类 型 变量 创造 一 个 新 的 T 类 型 变量 ， 而 ToOwned 一 般 是 从 一 个 &T 
类 型 变量 创造 一 个 新 的 U 类 型 变量 。 


在 标准 库 中 ，ToOwned 有 一 个 默认 实现 ， 即 调用 clone 方 法 : 





impl<T> ToOwned for T 
where T: Clone 
{ 


type Owned = T; 


fn to owned(&self) ->T{ 
self.clone() 
} 


fn clone_into(&self, target: &mut T) { 


target.clone_from(self); 





但 是 ， 它 还 对 一 些 特殊 类 型 实现 了 这 个 trait。 比 如 : 





impl<T: Clone> ToOwned for [T] { 
type Owned = Vec<T>; 


impl ToOwned for str { 
type Owned = String; 





而 且 ， 很 有 用 的 类 型 Cow 也 是 基于 ToOwned 实 现 的 : 





pub enum Cow<'a, B> 
where 

B: 'a + ToOwned + ?Sized, 
{ 


Borrowed(&'a B), 
Owned(<B as ToOwned>: :Owned), 





26.1.5 ToString/FromStr 


ToString trait 提 供 了 其 他 类 型 转换 为 String 类 型 的 能 





pub trait ToString { 
fn to_string(&self) -> String; 
} 








一 般 情况 下 ， 我 们 不 需要 自己 为 自 定义 类 型 实现 ToString trait。 因 
为 标准 库 中 已 经 提供 了 一 个 默认 实现 ; 











impl<T: fmt::Display + ?Sized> ToString for T { 

#[inline] 

default fn to_string(&self) -> String { 
use core::fmt: :Write; 
let mut buf = String: :new(); 
buf .write fmt(format_args!("{}", self)) 

.expect("a Display implementation return an error unexpectedly"); 

buf.shrink_to_fit(); 
buf 





这 意味 着 ， 任 何 一 个 实现 了 Display trait 的 类 型 ， 都 自动 实现 了 
ToString trait。 而 Display trait 是 可 以 自动 derive 的 ， 我 们 只 需要 为 类 型 添 
加 一 个 attribute 即 可 。 


FromStr 则 提供 了 从 字符 串 切片 &str 向 其 他 类 型 转换 的 能 





pub trait FromStr { 

type Err; 

fn from_ str(s: &str) -> Result<Self, Self::Err>; 
} 





因为 这 个 转换 过 程 可 能 出 错 ， 所 以 from_str 方 法 的 返回 类 型 被 设计 
为 Result。 


正 是 因为 有 了 这 个 trait， 所 以 str 类 型 才 有 了 一 个 成 员 方法 parse: 





pub fn parse<F: FromStr>(&self) -> Result<F, F::Err> { .. } 





所 以 我 们 可 以 写 下 面 这 样 非常 清晰 直上 白 的 代码 : 





Jet four = "4".parse::<U32>()， 
assert_eq!(Ok(4), four); 





26.2 ”运算 符 重 载 


Rnust 人 允许 一 部 分 运算 符 重 载 ， 用 户 可 以 让 这 些 运 算 符 文 持 目 定 义 类 
型 。 运 算 符 重 载 的 方式 是 : 针对 自 定 义 类 型 ，impl 一 些 在 标准 库 中 预定 
义 好 的 trait， 这 些 trait 者 存在 于 std; : 0ps 模 块 中 。 比 如 前 面 已 经 讲 过 了 
的 Deref trait 束 属于 运算 符 重 载 。 


本 章 我 们 以 最 基本 的 Add trait 来 做 讲解 。Add 代 表 的 是 加 法 运算 符 
+ 重 载 。 它 的 定义 是 : 








trait Add<RHS = Self> { 

type Output,; 

fn add(self, rhs: RHS) -> Self::Output; 
} 





它 具 备 一 个 泛 型 参数 RHS 和 一 个 关联 类 型 Output。 其 中 RHS 有 一 个 
默认 值 Self。 


标准 库 早 已 经 为 基本 数字 类 型 实现 了 这 个 trait。 比 如 : 





impl Add<i32> for i32 { 
type Output = i32; 





而 且 还 有 : 





impl<'a> Add<i32> for &'a i32 

type Output = <i32 as Add<i32>>: :Output; 
impl<'a> Add<&'a i32> for i32 

type Output = <i32 as Add<i32>>: :Output; 
impl<'a, 'b> Add<&'a i32> for &'b i32 

type Output = <i32 as Add<i32>>: :Output; 





这 意味 看 ， 不 仅 i132+i32 是 允许 的 ， 而 且 i32+&i32、&i32+i32、 
&i32+&i32 这 几 种 形式 也 都 是 允许 的 。 它 们 的 返回 类 型 都 是 132。 


假如 我 们 现在 自己 定义 了 一 个 复数 类 型 ， 想 让 它 文 持 加 法 运算 符 ， 


示例 如 下 : 





use std::ops::Add; 


#[derive(Copy, Clone, Debug, PartialEq)] 
struct Complex { 

real : i32, 

imaginary : i32, 


} 


impl Add for Complex { 
type Output = Complex; 


fn add(self, other: Complex) -> Complex { 
Complex { 
real: self.real + other.real, 
imaginary: self.imaginary + other.imaginary, 


} 


fn main() { 
let ci = Complex { real: 1, imaginary: 2}; 
let c2 = Complex { real: 2, imaginary: 4}; 
println!("{:?}", ci + c2); 











在 这 个 实现 中 ， 我 们 没有 指定 泛 型 参数 RHS， 所 以 它 就 采用 了 默认 
值 ， 在 此 示例 中 就 相当 于 Complex 这 个 类 型 。 同 理 ， 如 末 我 们 希望 让 这 
个 复数 能 文 持 与 更 多 的 类 型 求 和 ， 可 以 继续 写 多 个 impl: 





impl<'a> Add<&'a Complex> for Complex { 
type Output = Complex; 


fn add(self, other: &'a Complex) -> Complex { 
Complex { 
real: self.real + other.real, 
imaginary: self.imaginary + other.imaginary, 


} 


imp1 Add<i32> for Complex { 
type Output = Complex; 


fn add(self, other: i32) -> Complex { 
Complex { 
real: Self.real + other, 
imaginary: self.imaginary, 


26.3 LO 


标准 库 中 也 提供 了 一 系列 MO 相关 的 功能 。 昌 然 功能 比较 基础 ， 但 
ee 如 果 用 户 需 要 更 丰富 的 功能 ， 可 以 去 寻求 外 部 的 开源 


26.3.1 平台 相关 字符 串 


要 跟 操 作 系统 打交道 ， 首 先 需要 介绍 的 是 两 个 字符 串 类 型 
OsString 以 及 它 所 对 应 的 字符 串 切片 类 型 OosStr。 它 们 存在 于 std: : 值 模 
块 中 。 


Rust 标 准 的 字符 串 类 型 是 String 和 str。 它 们 的 一 个 重要 特点 是 保证 
了 内 部 编码 是 统一 的 utf-8。 但 是 ， 当 我 们 和 具体 的 操作 系统 打交道 时 ， 
统一 的 utf-8 编 码 是 不 够 用 的 ， 某 些 操作 系统 并 没有 规定 一 定 是 用 的 utf-8 
编码 。 所 以 ， 在 和 操作 系统 打交道 的 时 候 ， String/str 类 型 并 不 是 一 个 很 
好 的 选择 。 比 如 在 Windows 系 统 上 ， 字 符 一 般 是 用 16 位 数字 来 表示 的 。 


为 了 应 付 这 样 的 情况 ，Rust 在 标准 库 中 又 设计 了 OsString/OsStr 来 处 
理 这 样 的 情况 。 这 两 种 类 型 携带 的 方法 跟 String/str 非 党 类 似 ， 用 起 来 几 
乎 没什么 区 别 ， 它 们 之 间 也 可 以 相互 转换 。 


举 个 需要 用 到 OsStr 场 景 的 例子 : 

















use std::path::PathBuf; 


fn main() { 
let mut buf = PathBuf::from("/"); 
buf.set_file name("bar"); 


if let Some(s) = = buf.to_str() { 
println!("{}", Ss); 

} else { 
println!("invalid path"); 





上 面 这 个 例子 是 处 理 操作 系统 中 的 路 径 ， 束 必须 用 OsString/OsStr 这 


两 个 类 型 。PathBuf 的 set_file name 方法 的 签名 是 这 样 的 ; 





fn set_file name<S: AsRef<OsStr>>(&mut self, file name: S) 





它 要 求 ， 第 二 个 参数 必须 满足 AsRef<OsStr> 的 约束 。 而 查看 str 类 型 
的 文档 ， 我 们 可 以 看 到 : 





impl AsRef<OsStr> for str 








所 以 ，&str 类 型 可 以 直接 作为 参数 在 这 个 方法 中 使 用 。 


男 外 ， 当 我 们 想 把 &PathBuf 转 为 &str 类 型 的 时 候 ， 使 用 了 to_str 方 
法 ， 返 回 的 是 一 个 Option<&str> 类 型 。 这 是 为 了 错误 处 理 。 因 为 PathBuf 
内 部 是 用 OsString 存 储 的 字符 串 ， 它 未 必 能 成 功 转 为 utf-8 编 码 。 而 想 要 
把 &PathBuf 转 为 &OsStr 则 简单 多 了 ， 这 种 转换 不 需要 错误 处 理 ， 因 为 它 
们 是 同样 的 编码 。 


26.3.2 ”文件 和 路 径 


Rust 标 准 库 中 用 PathBuf 和 Path 两 个 类 型 来 处 理 路 径 。 它 们 之 间 的 关 
系 就 类 似 String 和 str 之 间 的 关系 : 一 个 对 内 部 数据 有 所 有 权 ， 还 有 一 个 
只 是 借用 。 实 际 上 ， 读 源码 可 知 ，PathBuf 里 面 存 的 是 一 个 OsString， 
Path 里 面 存 的 是 一 个 OsStr。 这 两 个 类 型 定义 在 std: : path 模 块 中 。 


Rust 对 文件 操作 主要 是 通过 std: : fs: : File 来 完成 的 。 这 个 类 型 
定义 了 一 些 成 员 方 法 ， 可 以 实现 打开 、 创 建 、 复 制 、 修 改 权 限 等 文件 操 
作 。std: : fs 模块 下 还 有 一 些 独立 函数 ， 比 如 remove_file、soft_link 
等 ， 也 是 非常 有 用 的 。 


对 文件 的 读 写 ， 则 需要 用 到 std: : io 模 块 了 。 这 个 模块 内 部 定义 了 
几 个 重要 的 trait， 比 如 Read/Write。File 类 型 也 实现 了 Read 和 Write 两 个 
trait， 因 此 它 拥 有 一 系列 方便 读 写 文件 的 方法 ， 比 如 read、 
read_to_end、read_to_string 等 。 这 个 模块 还 定义 了 BufReader 等 类 型 。 我 
们 可 以 把 任何 一 个 满足 Read trait 的 类 型 再 用 BufReader 包 一 下 ， 实 现 有 
绥 冲 的 读 取 。 





下 面 用 一 个 示例 来 演示 说 明 这 些 类 型 的 使 用 方法 : 





USe std::io::prelude::*; 
use Std: :io::BufReader 
use std::fs::File; 


fn test_read file() -> Result<(), std::io::Error> { 


let mut path = std::env::home_ dir().unwrap(); 
path.push(".rustup"); 

path.push("settings"); 
path.set_extension("toml"); 


let file = File::open(&path )?， 
let reader = BufReader: :new(file); 


for line in reader.lines() { 
println!("Read a line: {}", line?); 


ok( ()) 
} 


fn main() { 
match test_read file() { 
ok(_) => {} 


Err(e) => 
println!("Error occured: {}", e); 





26.3.3 ”标准 输入 输出 





前 面 我 们 已 经 多 次 使 用 了 println! 宏 输出 一 些 信 息 。 这 个 宏 很 方 
便 ， 特 别 适合 在 小 程序 中 随手 使 用 。 但 是 如 果 你 需要 对 标准 输入 输出 作 
更 精细 的 控制 ， 则 需要 使 用 更 复杂 一 扣 的 办 法 。 


在 C++ 里 面 ， 标 准 输入 输出 流 cin、cout 是 全 局 变量 。 在 Rust 中 ， 基 
于 线程 安全 的 考虑 ， 获 取 标 准 输 入 输出 的 实例 需要 调用 函数 ， 分 别 为 
std: : io: : stdin () 和 std: : io: : stdout () 。stdin () 函数 返回 
的 类 型 是 Stdin 结 构 体 。 这 个 结构 体 本 身 已 经 实现 了 Read trait， 所 以 ， 可 
以 直接 在 其 上 调用 各 种 读 取 方法 。 但 是 这 样 做 效率 比较 低 ， 因 为 为 了 线 
程 安全 考虑 ， 每 次 读 取 的 时 候 ， 它 的 内 部 都 需要 上 锁 。 提 高 执行 效率 的 
办 法 是 手动 调用 lock() 方法 ， 在 这 个 锁 的 期 间 内 多 次 调用 读 取 操作 ， 
来 避免 多 次 上 锁 。 








示例 如 下 : 





USe std::io::prelude::*; 
use std: :io::BufReader 


fn test_stdin() -> Result<(), std::io::Error> { 
let stdin = std::io::stdin(); 
let handle = stdin.lock(); 
let reader = BufReader: :new(handle); 


for line in reader.lines() { 
let line = line?; 
if line.is empty() { 
return Ok(()); 


} 
println!("Read a line: {}", line); 
} 


ok(()) 
fn main() { 


match test_stdin() { 
ok(_) => {} 


Err(e) => { 
println!("Error occured: {}", e); 





26.3.4 ”进程 启动 参数 


大 家 应 该 注意 到 了 ，Rust 的 main 函 数 的 签名 和 C/C++ 不 一 致 。 在 
C/C++ 里 面 ， 一 般 进 程 启动 参数 是 直接 用 指针 传递 给 main 函 数 的 ， 进 程 
返回 值 是 通过 main 函 数 的 返回 值 来 决定 的 。 


在 Rust 中 ， 进 程 启动 参数 是 调用 独立 的 函数 std: : env: : args () 
来 得 到 的 ， 或 者 使 用 std: : env: : args_os《〈) 来 得 到 ， 进 程 返 回 值 也 
是 调用 独立 函数 std: : process: : exit 〈() 来 指定 的 。 示 例如 下 : 











fn main() { 
if std::env::args().any(|arg| arg == "-kill") { 
std::process: :exit(1); 


for arg in std::env::args() { 
println!("{}", arg); 


同样 ， 标 准 库 只 提供 最 基本 的 功能 。 如 果 读 者 需要 功能 更 强大 、 更 
容易 使 用 的 命令 行 参 数 解 析 器 ， 可 以 到 crates.io 上 搜索 相关 开源 库 ，clap 
或 者 getopts 都 是 很 好 的 选择 。 


20.4 Any 


Rust 标 准 库 中 提供 了 一 个 乞丐 版 的 “反射 * 功 能 ， 那 束 是 std: : any 
模块 。 这 个 模块 内 ， 有 个 trait 名 字 叫 作 Any。 上 所 有 的 类 型 都 自动 实现 了 
Any 这 个 trait， 因 此 我 们 可 以 把 任何 一 个 对 象 的 引用 转 为 &Any 这 个 trait 
object， 人 然后 调用 它 的 方法 。 


它 可 以 判断 这 个 对 象 是 什么 类 型 ， 以 及 强制 转换 &Any 为 某 个 具体 
类 型 。 另 外 ， 成 员 函 数 get_type_id〈) 暂时 要 求 'static 约 束 ， 这 个 限制 条 
件 以 后 会 放宽 。 


基本 用 法 示例 如 下 : 





#![feature(get type_id)] 


use std::fmt::Display; 
use std::any::Any; 


fn log<T: Any + Display>(value: &T) { 
let value any = Value as &Any; 


If let Some(s) = value any.downcast ref::<String>() { 
println!("String: {€}", Ss); 


else if let Some(i) = value any.downcast ref::<i32>() { 
println!("i32: {}", i); 

} else { 
let type_id = value any.get_ type_id(); 
println!("unknown type {:?}: {}", type_id, value); 


} 
fn do_work<T: Any + Display>(value: &T) { 
log(value); 


fn main() { 
let my_string = "Hello World".to_string(); 
do_work(&my_string); 


let my_i32: i32 = 100; 
do_work(&my_i32); 


let my_char: char = '®'，; 
do_work(&my_char ); 


= 


第 四 部 分 “线程 安全 


Rust 不 仅 在 没有 自动 垃圾 回收 〈Garbage Coll-ection) 的 条 件 下 实现 
了 内 存 安全 ， 而 且 实 现 了 线程 安全 。Rnust 编 译 器 可 以 在 编译 阶段 避免 所 
有 的 数据 竞争 〈Data Race) 问题 。 这 也 是 Rust 的 核心 竞争 力 之 一 。 本 部 
分 主要 讲解 Rust 是 如 何 实现 免疫 数据 竞争 的 。 











第 27 章 ”线程 安全 
27.1 什么 是 过 种 


线程 是 操作 系统 能 够 进行 调度 的 最 小 单位 ， 它 是 进程 中 的 实际 运作 
单位 ， 每 个 进程 至 少 包含 一 个 线程 。 在 多 核 处 理 器 越 来 越 普及 的 今天 ， 
多 线程 编程 也 用 得 越 来 越 广 泛 。 多 线程 的 优势 有 : 


容易 利用 多 核 优势 ; 

比 单线 程 反 应 更 敏捷 ， 比 多 进程 资源 共享 更 容易 。 

多 线程 编程 在 许多 领域 是 不 可 或 缺 的 。 但 是 ， 多 线程 并 行 ， 非 常 容 
易 引 发 数据 竞争 ， 而 且 还 非常 不 容易 被 发 现 和 debug。 和 下面， 我 们 用 


en 
i 














#include <iostream> 
#include <stdlib.h> 
#include <thread> 
#include <string> 


#define COUNT 1000000 
volatile int g_num = 0; 


void thread1( ) 


for (int i=0; i<COUNT; I++){ 
g_num++， 
} 


} 
void thread2() 


for (int i=0; i<COUNT; I++){ 
g_num--， 
} 


} 

int main(int argc, char* argv[]) 
std::thread ti1i(thread1); 
std::thread t2(thread2); 


t1.join(); 
t2.join(); 


std::cout << "final value:" << g_num << std::endl; 
return ©; 


} 





我 们 可 以 使 用 g++-pthread-std=c++11 temp.cpp 命 令 编译 这 上段 代码 。 


在 这 段 代码 中 ， 我 们 创建 了 两 个 线程 。 一 个 线程 去 修改 全 局 变量 
明 obal， 循 坏 1000000 次 加 1。 为 外 一 个 线程 也 去 修改 全 局 变量 global， 御 
坏 1000000 次 减 1。 如 琳 没 有 数据 竞争 的 话 ， 这 两 个 线程 执行 完毕 后 ， 数 
据 最 终 一 定 是 回 到 初始 值 0。 然 而 ， 我 们 尝试 运行 后 友 现 ， 每 次 执行 的 
结 末 都 不 是 0， 而 且 每 次 的 结果 都 不 一 样 。 


为 什么 会 发 生 这 样 的 现象 呢 ? 这 是 因为 ， 为 普通 变量 加 1 减 1 这 样 的 
操作 并 非 “ 原 子 ” 操 作 。 我 们 简化 一 下 这 个 过 程 ， 可 以 将 它 分 为 三 个 步 
又 : 读数 据 、 执 行 计算 、 写 数据 。 理 想 情 况 下 ， 我 们 期 望 的 执行 流程 应 
该 是 下 面 这 样 的 : 








Thread 1 变量 值 

| | 0 

读数 据 0 
加 1 0 
写 数 据 1 
1 

1 

0 





然而 ， 线 程 的 调度 是 不 受 我 们 控制 的 ， 即 便 线程 1 和 线程 2 内 部 的 执 
行 流程 不 变 ， 只 要 调度 时 机 发 生 了 变化 ， 结 果 也 会 不 同 。 比 如 实际 的 执 
行 过 程 中 ， 有 可 能 是 这 样 的 情况 : 





Thread 1 变量 值 
(me | ue 0 
读数 据 [| 0 
读数 据 | 0 
加 1 | -| 0 
| 0 
写 数据 [| 1 
写 数据 ; -1 








根据 调度 情况 的 不 同 ， 最 终 的 结果 也 会 有 所 差异 ， 所 以 我 们 可 以 看 








到 这 个 程序 的 执行 结果 不 是 0， 而 且 循环 次 数 越 多 ， 发 生 数据 竞争 的 机 
会 也 越 大 。 


在 传统 的 系统 级 编程 语言 中 ， 写 多 线程 代码 很 容易 出 错 。 而 Rust 的 
0 
王 o 





27.2 ”启动 线程 


Rust 标 准 库 中 与 线程 相关 的 内 容 在 std: : thread 模 块 中 。Rust 中 的 
线程 是 对 操作 系统 线程 的 直接 封闭。 


创建 线程 的 方法 为 : 





use std::thread; 
thread::spawn(move || { 

// 这 里 是 新 建 线程 的 执行 逻辑 
}); 























默认 情况 下 ， 新 创建 的 子 线程 与 原来 的 父 线程 是 分 离 的 天 系 。 也 就 
是 说 ， 子 线程 可 以 在 父 线 程 结束 后 继续 存在 ， 除 非 父 线程 是 主线 程 。 因 
为 我 们 知道 ， 如 果 一 个 进程 的 主线 程 也 退出 了 ， 这 个 进程 就 会 终止 ， 其 
他 所 有 的 线程 也 会 随 之 结束 。 


如 果 我 们 需要 等 待 子 线程 执行 结束 ， 那 么 可 以 使 用 join 方法 : 














use std::thread; 
// child 的 类 型 是 JoijnHandle<T>, 这 个 T 是 闭 包 的 返回 类 
let child = thread::spawn(move || { 


// 子 线程 的 逻辑 


}); 
// 父 线 程 等 待 子 线程 结束 
Jet res = child.join(); 





入 




















如 果 我 们 需要 为 子 线 程 指定 更 多 的 参数 信息 ， 那 么 在 创建 的 时 候 可 
以 使 用 Builder 模 式 : 





use std::thread; 


thread: :Builder::new().name("childi1".to_string()).spawn(move || { 
println!("Hello, world!"); 
/ 








thread 模 块 还 提供 了 下 面 儿 个 工具 函数 。 


(1) thread: : sleep (dur: Duration ) 


使 得 当前 线程 等 待 一 段 时 间 继 续 执 行 。 在 等 待 的 时 间 内 ， 线 程 调度 
虱 会 调度 其 他 的 线程 来 执行 。 


(2) thread: : yield now () 

放弃 当前 线程 的 执行 ， 要 求 线程 调 上 度 费 执行 线程 切换 。 
(3) thread: : current () 

获得 当前 的 线程 。 
(4) thread: : park () 


和 暂停 当前 线程 ， 进 入 等 待 状态 。 当 thread: : Thread: : 
unpark(&self) 方法 被 调用 的 时 候 ， 这 个 线程 可 以 被 恢复 执行 。 


(5) thread: : Thread: : unpark (&self) 
恢复 一 个 线程 的 执行 。 
以 上 子 数 的 综合 使 用 见 如 下 示例 : 





Use std::thread; 
Use std::time::Duration; 


fn main() { 
let t = thread::Builder::new() 
.Name("child1".to_string()) 
,Spawn(move || { 
println!("enter child thread."); 
thread: :park(); 
println!("resume child thread"); 
}) .unwrap( ); 
println!("spawn a thread"); 
thread: :sleep(Duration: :new(5,0)); 
t.thread().unpark(); 
t.join(); 
println!("child thread finished"); 
} 


OOOO-4 


27.3 ” 免 数 据 竞争 


粗 看 起 来 ，Rust 的 多 线程 API 很 简单 。 但 其 实 ， 其 表面 的 简洁 之 下 
隐藏 着 关键 的 创新 设计 。 正 可 请 : 


胸 有 激 雷 而 面 如 平湖 者 ， 可 拜 上 将 军 也 ! 


为 了 说 明 Rust 在 多 线程 方面 的 威力 ， 我 们 来 做 几 个 实验 ， 看 看 如 果 
用 多 个 线程 读 写 同一 个 变量 会 发生 什么 情况 。 


我 们 创建 一 个 子 线程 ， 用 它 修 改 一 个 外 部 变量 : 











use std::thread; 
fn main() { 
let mut health = 12; 
thread::spawn( || { 
ealth *= 2;， 


}); 
println!("{}", health); 





编译 ， 发 生 错 误 。 错误 信息 为 : 





error: closure may outlive the current function, but it borrows health, which Is owr 





根据 前 面 的 知识 可 以 知道 ，spawn 函 数 毛 受 的 参数 是 一 个 闭 包 。 我 
们 在 财 包 里 面 引用 了 函数 体内 的 局 部 变量 ， 而 这 个 闭 包 是 运行 在 男 外 一 
个 线程 上 ， 编 译 器 无 法 肯定 局 部 变量 health 的 生命 周期 一 定 大 于 闭 包 的 
生命 周期 ， 于 是 发 生 了 错误 。 


那 我 们 对 这 个 程序 做 一 个 修改 ， 把 闭 包 加 上 move 修 饰 。 再 次 编 
译 ， 可 见 编译 错误 已 经 消失 。 但 是 执行 发 现 ， 变 量 health 的 值 并 未 发 生 
改变 。 为 什么 呢 ? 因为 health 是 Copy 类 型 ， 在 遇 到 move 型 团 包 的 时 候 ， 
ee 外 面 的 变量 并 没有 被 真正 修 
改 。 

















如 果 我 们 使 用 的 是 非 Copy 类 型 ， 又 会 怎样 呢 ? 





use std::thread; 
fn main() { 
let mut v : Vec<i32> = vec![]; 


thread::spawn( || { 
v.push(1); 
}); 


println!("{:?}", VvV); 





编译 ， 出 现 同样 的 错误 。 再 次 尝试 给 闭 包 加 上 move， 还 是 出 现 纺 
译 错误 : 





error: use of moved value: v 





这 个 错误 也 好 理解 : 既然 我 们 已 经 把 v 移 动 到 了 闭 包 里 面 ， 那 么 它 
在 本 函数 内 束 不 能 再 继续 使 用 了， 因为 其 所 有 权 已 经 移 走 了 。 


以 上 这 几 个 试验 全 部 失败 了 ， 那 我 们 完 苋 怎样 做 才能 让 一 个 变量 在 
不 同 线程 中 共享 呢 ? 


答案 是 : 我 们 没有 办 法 在 多 线程 中 直接 读 写 普 遂 的 共 诗 变量 ， 
使 用 Rust 提 供 的 线程 安全 相关 的 设施 。 


也 惑 是 说 ，Rnust 给 我 们 提供 了 一 个 重要 的 安全 保证 : 


AS 


余 非 


The compiler prevents all data races. 
“data race” 即 数据 苋 争 ， 意 思 是 在 多 线程 程序 中 ， 不 同 线程 在 没有 


0 
情况 。 

在 笔者 看 来 ， 这 是 一 项 革命 性 的 进步 ， 非 常 值得 关注 。 

在 许多 传统 《〈 非 函数 式 ) 的 编程 语言 中 ， 并 行程 序 设计 是 非常 困难 


的 ， 原 因 惑 在 于 代码 中 存在 大 量 的 共 孚 状态 和 很 多 隐藏 的 数据 依赖 。 程 
序 员 必 须 非 常 清楚 代码 的 流程 ， 使 用 合适 的 策略 正确 实现 并 发 控制 。 而 























万 一 某 人 在 某 个 地 方 犯 了 一 个 小 错误 ， 那 么 这 个 程序 就 成 了 不 安全 的 ， 
而 且 没 有 什么 静态 检查 工具 可 以 保证 完整 无 遗漏 地 将 此 类 问题 检查 出 
来 。 对 于 一 份 规模 比较 大 的 C/C++ 源 代 码 ， 我 们 没有 什么 好 办 法 “证 
明 ” 一 个 程序 是 不 是 “线程 安全 ”的 。 况 且 ， 人 非 针 贤 ， 就 能 无 过 ， 就 像 
墨 菲 定律 次 的 那样 : 


Murphey’s Law 





Anything that can go wrong, will go wrong. 


有 很 多 人 尝试 过 很 多 办 法 ， 来 从 根源 上 解决 数据 竞争 〈Data race ) 
的 问题 。 根 据 数 据 竞争 的 定义 ， 它 的 发 生 需要 三 个 条 件 : 


“数据 共 译 一 一 有 多 个 线程 同时 访问 一 份 数据 ; 








数据 修改 一 一 至 少 存 在 一 个 线程 对 数据 做 修改 ; 
” “没有 同步 一 一 至 少 存在 一 个 线程 对 数据 的 访问 没有 使 用 同步 措 
施 。 


我 们 只 要 让 这 三 个 条 件 无 法 同时 发 生 即 可 : 


:可 以 禁止 数据 共享 ， 比 如 actor-based concurrency， 多 线程 之 间 的 通 
信 仅 靠 发 送 消息 来 实现 ， 而 不 是 通过 共享 数据 来 实现 ; 


:可 以 禁止 数据 修改 ， 比 如 functional programming， 许 多 函数 式 编程 
语言 严格 限制 了 数据 的 可 变性 ， 而 对 共享 性 没有 限制 。 


然而 以 上 设计 在 许多 情况 下 都 有 一 些 性 能 上 的 缺陷 ， 无 法 达到 " 堆 
开销 抽象 "的 目的 。 


Rust 并 没有 盲目 跟随 传统 语言 的 脚步 设计 。Rust 人 允许 存在 可 变 变 
量 ， 人 允许 存在 状态 共享 ， 同 时 也 做 到 了 完整 无 遗漏 的 线程 安全 检查 。 
因为 Rust 设 计 的 一 个 核心 思想 就 是 “共享 不 可 变 ， 可 变 不 共享 "， 然 后 再 
加 上 类 型 系统 和 合理 的 API 设 计 ， 就 可 以 保证 共享 数据 在 访问 时 一 定 使 
用 了 同步 措施 。Rust 既 可 以 支持 多 线程 数据 共享 的 风格 ， 也 可 以 支持 消 
恩 通 信 的 风格 。 无 论 选 择 哪 种 方案 ， 编 译 占 都 能 保证 没有 数据 苋 争 。 


请 注意 这 个 区 别 : 我 们 不 是 说 传统 C/C++ 就 无 法 做 到 线程 安全 ， 而 
是 说 ， 传 统 C/C++ 需 要 依赖 程序 员 不 犯错 误 来 保证 线程 安全 ; 而 Rust 是 
由 工具 自动 保证 的 ， 这 个 保证 更 稳定 、 更 可 靠 、 更 有 底气 。 虽 然 



































C/C++ 里 面 也 有 许多 静态 检查 工具 ， 可 以 辅助 我 们 目 动 发 现 一些 线 程 安 
全 问题 ， 但 是 由 于 C/C++ 灵 活 度 太 大 、 目 由 度 太 高 ， 因 此 可 以 肯定 的 是 
没有 任何 一 球 静 态 检 查 工具 可 以 保证 百 分 百 “无 遗漏 、 无 误 报 ”的 线程 安 
全 检查 。 现 在 没有 ， 将 来 也 不 可 能 有 。 所 以 不 得 不 依赖 程序 员 的 水 平 。 
在 代码 规模 大 到 一 定 程度 之 后 ， 这 种 做 法 是 不 可 徘 的 ， 不 论 一 个 人 实力 
有 多 强 ， 总 有 马虎 的 时 候 、 疲 惫 的 时 候 、 情 绪 不 良 的 时 候 ， 偶 尔 犯 错 是 
不 可 避免 的 ， 更 何况 大 规模 的 团队 存在 管理 配合 问题 、 人 员 流 动 区 接 问 
题 等 ， 一 不 小 心 就 会 埋 下 一 个 隐患 。 作 为 对 比 ，Rust 对 线程 的 安全 检查 
古 稳定 的 、 可 徘 的 ， 不 因 时 因 地 而 有 所 波动 ， 不 因 代码 量 的 多 少 或 复杂 
a 0 i 
常 的 意义 。 























这 个 区 别 赋予 了 Rust 一 种 特殊 的 能 力 ， 它 使 Rust 的 使 用 者 有 了 更 强 
大 的 自信， 让 Rnust 的 使 用 者 有 胆量 使 用 更 激进 的 并 行 优 化 。 


27.4 Send & Sync 


下 面 来 简单 讲解 一 下 Rust 是 如 何 实现 免疫 数据 竞争 的 。Rnust 线 程 安 
背后 的 功臣 是 两 个 特殊 的 trait。 


‘std: : marker: : Sync 


如 果 类 型 ?实现 了 Sync 类 型 ， 那 说 明 在 不 同 的 线程 中 使 用 &T 访 问 同 
一 个 变量 是 安全 的 


std: : marker: : Send 


如 果 类 型 T 实 现 了 Send 类 型 ， 那 说 明 这 个 类 型 的 变量 在 不 同 的 线程 
中 传递 所 有 权 是 安全 的 。 


Rust 把 类 型 根据 Sync 和 Send 做 了 分 类 。 这 样 做 起 什么 作用 呢 ? 当然 
是 用 在 “ 泛 型 约束 ”中 。Rust 中 所 有 跟 多 线程 有 关 的 API， 会 根据 情况 ， 
麦 求 关 王 必 须 满 征 Sync 或 者 Send 的 约束 。 这 样 一 来 ,“ 孙 猴子 就 永远 也 
逃 不 出 如 来 佛 的 手掌 心 ” 了 。 你 不 可 能 随意 在 多 线程 之 间 共 享 变量 ， 也 
全国 上 EE 在 使 用 多 线程 共享 的 时 候 忘 记 加 锁 。 除 非 你 使 用 unsafe， 否 则 不 
可 能 写 出 存在 :数据 竞争 ， 的 代码 来 。 


人 最 常见 的 创建 线程 的 函数 spawn， 它 的 完整 函数 签名 是 这 





pub fn spawn<F, T>(f: F) -> JoinHandle<T> 
where F: Fnonce() -> T, F: Send + 'static, T: Send + 'static 


我 们 需要 注意 的 是 ， 参 数 类 型 F 有 重要 的 约束 条 件 F: Send+'static， 
T: Send+t'static。 但 几 在 线程 之 间 传 北 了 所有权 会 发 生 安 全 问题 的 关于 ， 
都 无 法 在 这 个 参数 中 出 现 ， 否 则 就 是 编译 错误 。 另 外 ，Rust 对 全 局 变量 
也 有 很 多 限制 ， 你 不 可 能 简单 地 通过 全 局 变量 在 多 线程 中 随意 共享 状 
态 。 这 样 ， 编 译 器 束 会 禁止 挥 可 能 有 人 危险 的 线程 则 共享 数据 的 行为 。 


在 Rust 中 ， 线 程 安 全 是 默认 行为 ， 大 部 分 类 型 在 单线 程 中 是 可 以 随 
意 共 享 的 ， 但 是 没 办 法 直接 在 多 线程 中 共享 。 也 就 是 说 ， 只 要 程序 员 不 














滥用 unsafe，Rust 编 译 器 就 可 以 检查 出 所 有 具有 “数据 芝 争 ”潜在 风险 的 
代码 。 几 是 通过 了 编译 检查 的 代码 ，Rust 可 以 保证 ， 绝 对 不 会 出 现 “ 线 
程 不 安全 ”的 行为 。 如 此 一 来 ， 多 线程 代码 和 单线 程 代 码 就 有 了 严格 的 
分 野 。 一 般 情 况 下 ， 我 们 不 需要 考虑 多 线程 的 问题 。 即 便 是 万 一 不 小 心 
在 多 线程 中 访问 了 原本 只 设计 为 单线 程 使 用 的 代码 ， 编 译 器 也 会 报错 。 





第 28 章 “详解 Send 和 Sync 


在 上 文中 我 们 已 经 提 到 ，Rust 实 现 免疫 数据 竞争 的 关键 是 Send 和 
Sync 这 两 个 tait。 那 么 这 两 个 trait 究 竟 表 达 了 什么 意思 ? 它们 背后 是 什 
人 么 原理 ? 我 们 在 本 章 详细 分 析 。 





28.1 什么 是 Send 


根据 定义 : 如 果 类 型 T 实 现 了 Send trait， 那 说 明 这 个 类 型 的 变量 在 
不 同 线程 中 传递 所 有 权 是 安全 的 。 但 这 人 句 话 对 于 初学 者 并 不 是 那么 容易 
理解 的 。 究 竟 具 备 什 么 特点 的 类 型 才 满足 Send 约 束 ? 本 节 就 来 详细 分 析 
es 


如 果 一 个 类 型 可 以 安全 地 从 一 个 线程 move 进 入 男 一 个 线程 ， 那 它 
就 是 Send 类 型 。 比 如 : 普通 的 数字 类 型 是 Send， 因 为 我 们 把 数字 move 
进入 男 一 个 线程 之 后 ， 两 个 线程 同时 执行 也 不 会 造成 什么 安全 问题 。 


更 进一步 ， 内 部 不 包含 引用 的 类 型 ， 痢 是 Send。 因 为 这 样 的 类 型 跟 
外 界 没有 什么 关联 ， 当 它 被 move 进 入 男 一 个 线程 之 后 ， 它 所 有 的 部 分 
都 跟 原 来 的 线程 没什么 关系 了， 不 会 出 现 并 发 访问 的 情况 。 比 如 String 


类 型 。 


稍微 复杂 一 点 的 ， 具 有 泛 型 参数 的 类 型 ， 是 否 满足 Send 大 多 是 取 诀 
于 参数 类 型 是 否 满足 Send。 比 如 Vec<T>， 只 要 我 们 能 保证 T: Send， 那 
么 Vec<T> 肯 定 也 是 Send， 把 它 move 进 入 其 他 线程 是 没什么 问题 的 。 再 
比如 Cell<T>、RefCell<T>、Option<T>、Box<T>， 也 都 是 这 种 情况 。 


还 有 一 些 类 型 ， 不 论 泛 型 参数 是 人 否 满足 Send， 都 是 满足 Send 的 。 这 
种 类 型 ， 可 以 看 作 一 种 “构造 器 ”， 把 不 满足 Send 条 件 的 类 型 用 它 包 起 
来 ， 就 变 成 了 满足 Send 条 件 的 类 型 。 比 如 Mnutex<T> 就 是 这 种 。 
Mutex<T> 这 个 类 型 实际 上 不 关心 它 内 部 类 型 是 怎样 的 ， 反 正 要 访问 内 
部 数据 ， 一 定 要 调用 lock() 方法 上 锁 ， 它 的 所 有 权 在 哪个 线程 中 并 不 
重要 ， 所 以 把 它 move 到 其 他 线程 也 是 没有 问题 的 。 


那么 什么 样 的 类 型 是 ! Send 呢 ?上 典型 的 如 Rc<T> 类 型 。 我 们 知道 ， 
Rc 是 引用 计数 指针 ， 把 Rc 类 型 的 变量 move 进 入 另外 一 个 线程 ， 只 是 其 
中 一 个 引用 计数 指针 move 到 了 其 他 线程 ， 这 样 会 导致 不 同 的 线程 中 的 
Rc 变量 引用 同一 块 数据 ，Rc 内 部 实现 没有 做 任何 线程 同步 处 理 ， 这 是 
肯定 有 问题 的 。 所 以 标准 库 中 早已 指定 Rc 是 ! Send。 当 我 们 试图 在 线程 
边界 传递 这 个 类 型 的 时 候 ， 就 会 出 现 编译 错误 。 


但 是 相对 的 是 ，Arc<T> 类 型 是 符合 Send 的 《当然 需要 T: Send) 。 











为 什么 呢 ? 因为 Arc 类 型 内 部 的 引用 计数 用 的 是 “原子 计数 ”， 对 它 进 行 
增 减 操作 ， 不 会 出 现 多 线程 数据 竞争 。 所 以 ， 多 个 线程 拥有 指 同 同一 个 
变量 的 Arc 指 针 是 可 以 接受 的 。 


28.2 ”什么 是 Sync 


对 应 的 ，Sync 的 定义 是 ， 如 果 类 型 T 实 现 了 Sync trait， 那 说 明 在 不 
同 的 线程 中 使 用 &T 访 问 同一 个 变量 是 安全 的 。 这 人 句 话 也 不 好 理解 。 下 
面 我 们 仔细 分 析 一 下 哪些 类 型 是 满足 Sync 约束 的 。 


显然 ， 基 本 数字 类 型 肯定 是 Sync。 假 如 不 同 线程 都 拥有 指向 同一 个 
i32 类 型 的 只 读 引 用 &i32， 这 是 没什么 问题 的 。 因 为 这 个 类 型 引用 只 能 
读 ， 不 能 写 。 多 个 线程 读 同一 个 整数 是 安全 的 。 


大 部 分 具有 泛 型 参数 的 类 型 是 否 满足 Sync， 很 多 都 是 取决 于 参数 类 
型 是 否 满足 Sync。 像 Box<T>、Vec<T>Option<T> 这 种 也 是 Sync 的 ， 只 
要 其 中 的 参数 T 是 满足 Sync 的 。 


也 有 一 些 类 型 ， 不 论 泛 型 参数 是 否 满足 Sync， 它 都 是 满足 Sync 的 。 
这 种 类 型 把 不 满足 Sync 条 件 的 类 型 用 它 包 起 来 ， 就 变 成 了 满足 Sync 条 件 
的 。Mutex<T> 就 是 这 种 。 多 个 线程 同时 拥有 &Mutex<T> 型 引用 ， 指 问 


同一 个 变量 是 没 问 题 的 。 


那么 什么 样 的 类 型 是 ! Sync 呢 ?所 有 具有 “内 部 可 变性 ”而 又 没有 多 
线程 同步 考虑 的 类 型 都 不 是 Sync 的 。 比 如 ，Cell<T> 和 RefCell<T> 就 不 
能 是 Sync 的 。 按 照 定 义 ， 如 果 我 们 多 个 线程 中 都 持 有 指向 同一 个 变量 的 
&Cell<T> 型 指针 ， 那 么 在 多 个 线程 中 ， 都 可 以 执行 Cell:; : set 方 法 来 修 
改 它 里 面 的 数据 。 而 我 们 知道 ， 这 个 方法 在 修改 内 部 数据 的 时 候 ， 是 没 
有 考虑 多 线程 同步 问题 的 。 所 以 ， 我 们 必须 把 它 标 记 为 ! Sync。 


还 有 一 些 特殊 的 类 型 ， 它 们 既 具 备 内 部 可 变性 ， 又 满足 Sync 约束 ， 
比如 前 面 提 到 的 Mutex<T> 类 型 。 为 什么 说 Mutex<T> 具 备 内 部 可 变性 ? 
大 家 查 一 下 文档 就 会 知道 ， 这 个 类 型 可 以 通过 不 可 变 引 用 调用 lock () 
方法 ， 返 回 一 个 智能 指针 MutexGuard<T> 类 型 ， 而 这 个 智能 指针 有 权 修 
改 内 部 数据 。 这 个 做 法 就 跟 RefCell<T> 的 try_borrow_mut() 方法 非常 
类 似 。 区 别 只 是 : Mutex: : lock() 方法 的 实现 ， 使 用 了 操作 系统 提 
供 的 多 线程 同步 机 制 ， 实 现 了 线程 同步 ， 保 证 了 异步 安全 ; 而 RefCell 的 
内 部 实现 就 是 简单 的 普通 数字 加 减 操 作 。 因 此 ，Mutex<T> 既 具备 内 部 
可 变性 ， 又 满足 Sync 约束 。 除 了 Mutex<T>， 标 准 库 中 还 有 


RwLock<T>、AtomicBool、AtomicIsize、AtomicUsize、AtomicPtr 等 类 























型 ， 都 提供 了 内 部 可 变性 ， 而 且 满 足 Sync 约 束 。 


28.3 ”自动 推理 


Send 和 Sync 是 marker trait。 在 Rust 中 ， 有 一 些 trait 是 在 std: : marker 
模块 中 的 特殊 trait。 它 们 有 一 个 共同 的 特点 ， 束 是 内 部 都 没有 任何 的 方 
法 ， 它 们 只 用 于 给 类 型 做 “标记 ”。 在 std: : marker 这 个 模块 中 的 trait， 
都 是 给 类 型 做 标记 的 trait。 每 一 种 标记 都 将 类 型 严格 切 分 成 了 两 个 组 。 


我 们 可 以 从 源码 中 的 src/libcore/marker.rs 中 看 到 : 





unsafe impl Send for .. 
unsafe impl Sync for .. 


{3} 
{3} 





这 是 一 个 临时 的 、 特 殊 的 语法 ， 它 的 含义 是 : 针对 所 有 类 型 ， 默 认 
实现 了 Send/Sync。 使 用 了 这 种 特殊 语法 的 trait 叫 作 OIBIT (Opt-in built- 
in trait) ， 后 来 改称 为 Auto Trait。 注 意 : 这 个 语法 是 不 稳定 的 ， 以 后 会 
改变 。 不 管 怎样 ， 编 译 占 留 了 一 个 后 门 ， 可 以 让 我 们 定义 Auto Trait。 


Auto Trait 有 一 个 重要 特点 ， 束 是 编译 费 人 允许 用 户 不 用 手写 impl， 目 
动 根据 这 个 类 型 的 成 员 “ 推 理 ” 出 这 个 类 型 是 否 满 足 这 个 trait。 


我 们 可 以 手动 指定 这 个 类 型 满足 这 个 trait 约 束 ， 也 可 以 手动 指定 它 
不 满足 这 个 trait 约 束 ， 但 是 手动 指定 的 时 候 ， 一 定 要 用 unsafe 关 键 字 。 


比如 ， 在 标准 库 中 就 有 这 样 的 代码 : 




















unsafe impl<T: ?Sized> !Send for *const T {} 

unsafe impl<T: ?Sized> !Send for *mut T { } 

unsafe impl<'a, T: Sync + ?Sized> Send for &'aT {} 

unsafe impl<'a, T: Send + ?Sized> Send for &'a mut T {} 
// 等 等 





使 用 ! Send 这 种 写法 表示 “ 取 肥 ”操作 ， 这 些 类 型 束 一 定 不 满足 Send 
约束 。 


请 大 家 一 定 要 注意 unsafe 关 键 字 。 这 个 关键 字 在 这 里 的 意思 是 ， 编 
译 占 目 己 并 没有 能 力 正确 地 、 智 能 地 理解 每 一 个 类 型 的 内 部 实现 原理 ， 


并 由 此 判断 它 是 否 满足 Send 或 者 Sync。 它 需要 程序 员 来 提供 这 个 信息 。 
此 时 ， 编 译 絮 选择 相信 程序 员 的 判断 。 但 同时 ， 这 两 个 trait 对 于 “线程 安 
全 ”至 天 重要 ， 如 果 程 序 员 上 自己 在 这 里 判断 错 了 ， 束 可 能 制造 出 “线程 不 
安全 ”的 问题 。 


所 以 ， 这 里 的 规则 和 前 面 讲 的 “内 存 安全 ”的 情况 是 一 样 的 。 某 些 情 
况 下 ， 程 序 员 需要 做 底层 操作 的 时 候 ， 编 译 费 没有 能 力 判 断 这 部 分 是 不 
是 满足 内 存 安 全 ， 就 需要 程序 员 把 这 部 分 代码 用 unsafe 关 键 字 包 起 来 ， 
由 程序 员 去 负责 安全 性 。unsafe 关 键 字 的 意义 不 是 次 这 段 代 码 “ 不 安 
全 ”， 而 是 次 这 段 代 码 的 安全 性 编译 器 目 己 无 法 智能 检查 出 来 ， 需 要 由 
程序 员 来 保证 。 


标准 库 中 把 所 有 基本 类 型 ， 以 及 标准 库 中 定义 的 类 型 ， 都 做 了 合适 
的 Send/Sync 标 记 。 


同时 ， 由 于 Auto trait 这 个 机 制 的 存在 ， 绝 大 部 分 用 户 创 建 的 自 定义 
类 型 ， 本 身 都 已 经 有 了 合理 的 Send/Sync 标 记 ， 用 户 不 需要 手动 修改 
它 。 只 有 一 种 情况 例外 : 用 户 用 了 unsafe 代 码 的 时 候 ， 有 些 类 型 就 很 可 
能 需要 手动 实现 Send/Sync。 比 如 做 FFI， 在 Rust 项 目 中 调用 C 的 代码 。 
这 种 时 候 ， 类 型 内 部 很 可 能 会 包含 一 些 裸 指针 ， 各 种 方法 调用 也 会 有 许 
多 unsafe 代 码 块 。 此 时 ， 一 个 类 型 是 否 满足 Send/Sync 束 不 能 依赖 Auto 
Trait 机 制 由 编译 器 推理 了 ， 因 为 它 推 理 出 来 的 结论 很 可 能 是 错 的 。 程 序 
员 需 要 根据 Send/Sync 所 表达 的 概念 去 理解 这 个 类 型 的 逻辑 ， 然 后 自己 
判断 出 它 是 人 否 满足 Send/Sync 的 约束 。 在 这 种 情况 下 ， 写 这 个 库 的 程序 
员 就 成 了 实现 “线程 安全 ”目标 的 重要 一 环 。 如 果 写 错 了 ， 吏 会 对 下 游 用 
人 所 有 依赖 于 这 个 库 的 代码 都 有 可 能 引发 线程 不 安 
































38 小 乡 


Rust 语 言 本 身 并 不 知晓 “线程 ”并 发 ?具体 是 什么 ， 而 是 抽象 出 了 一 
些 更 高 级 的 概念 Send/Sync， 用 来 描述 类 型 在 并 发 环境 下 的 特性 。 
std: : thread: : spawn 函 数 就 是 一 个 普通 函数 ， 编 译 器 没有 对 它 做 任 
何 特殊 处 理 。 它 能 保证 线程 安全 的 关键 是 ， 它 对 参数 有 合理 的 约束 条 
件 。 这 样 的 设计 使 得 Rust 在 线程 安全 方面 具备 非常 好 的 扩展 性 。 很 多 高 
级 的 并 发 模型 ， 在 Rust 中 都 可 以 通过 第 三 方 库 的 形式 实现 ， 而 且 可 以 保 
证 线程 安全 特性 。 只 要 对 外 API 设 计 得 合理 ， 客 户 就 可 以 随便 使 用 这 些 
并 行 库 ， 而 不 会 有 数据 苋 争 的 风险 。 


Rust 的 这 个 设计 实际 上 将 开发 者 分 为 了 两 个 阵营 ， 一 部 分 是 核心 库 
的 开发 者 ， 一 部 分 是 业务 逻辑 开发 者 。 对 于 一 般 的 业务 开发 者 来 说 ， 完 
全 没有 必要 写 任 何 unsafe 人 代码， 更 没有 必要 为 自己 的 目 定义 类 型 去 实现 
Sync Send， 直 接 依 赖 编译 器 的 自动 推导 即 可 。 这 个 阵营 中 的 程序 员 可 
以 完全 享受 编译 如 和 基础 库 帝 来 的 安全 性 保证 ， 无 须 投 入 太 多 精力 去 管 
理 细 节 ， 极 大 地 减轻 脑力 负担 。 


而 对 于 核心 库 的 开发 者 ， 则 必须 对 Rust 的 这 套 机 制 非常 了 解 。 比 
如 ， 他 们 可 能 需要 设计 自己 的 “无 锁 数据 类 型 *% 线 程 池 ”管道 ”等 各 种 并 
行 编程 的 基础 设施 。 这 种 时 候 ， 束 有 必要 对 这 些 类 型 使 用 unsafe impl 
Send/Sync 设 计 合 适 的 接口 。 这 些 库 本 身 的 内 部 实现 是 基于 unsafe 代 人 码 做 
的 ， 它 享受 不 到 编译 器 提供 的 各 种 安全 检查 。 相 反 ， 这 些 库 本 喘 才 是 保 
证 业务 逻辑 代码 安全 性 的 关键 。 


这 个 区 分 对 整个 生态 圈 是 有 好 处 的 。 跟 前 面 讲 的 “内 存 安全 ”问题 类 
似 ， 需 要 使 用 unsafe 的 代码 总 是 很 小 的 一 部 分 ， 把 这 部 分 代码 抽象 到 独 
并 的 库 里 面 ， 是 比较 容易 测试 和 验证 它 的 正确 性 的 。 而 业务 逻辑 代码 才 
是 干 变 万 化 的 ， 我 们 干 万 不 要 在 这 部 分 代码 中 用 unsafe 做 各 种 hack。 
此 ， 大 部 分 普通 人 就 能 充分 享受 到 少 部 分 精英 给 我 们 提供 的 各 种 安全 性 
保证 “编译 器 加 基础 库 ) ， 放 心 大 胆 地 做 各 种 并 行 优化 ， 完 全 不 必 担 心 
会 制造 线程 安全 问题 。 























第 29 章 ”状态 共享 


前 面 我 们 已 经 看 到 ，Rust 可 以 阻止 在 多 线程 之 间 不 安全 的 共享 状 
。 本 章 我 们 来 讲解 一 下 ， 在 Rust 中 ， 如 何 使 用 标准 库 安 全 地 实现 多 线 
k 享 变量 。 





29.1 Arc 


Arc 是 Rc 的 线程 安全 版 本 。 它 的 全 称 是 “Atomic reference counter”。 
注意 第 一 个 单词 代表 的 是 atomic 而 不 是 automatic。 它 强调 的 是 “原子 
性 ”。 它 跟 Rc 最 大 的 区 别 在 于 ， 引 用 计数 用 的 是 原子 整数 类 型 。Arc 使 用 
方法 示例 如 下 : 





use std::sync::Arc,; 
use std::thread; 


fn main() { 
let numbers: Vec< > = (0..100u32).collect!(); 
// 引用 计数 指针 , 指向 一 个 Vec 


let shared numbers = Arc::new(numbers); 














// 循环 创建 10 个 线程 
for _ in 0..10 { 
// 复制 引用 计数 指针 ,所 有 的 Arc 都 指向 同一 个 Vec 
let child_numbers = shared_ numbers.clone(); 
// move 修 饰 闭 包 , 上 面 这 个 Arc 指针 被 move 进入 了 新 线程 中 
thread::spawn(move || { 
// 我 们 可 以 在 新 线程 中 使 用 Arc, 读 取 共享 的 那个 Vec 
let local numbers = &child numbers[..]; 


// 继续 使 用 Vec 中 的 数据 
} 






































了 





这 段 代码 可 以 正常 编译 通过 。 
如 果 我 们 把 上 面 代码 中 的 Arc 改 为 Rc 类 型 ， 就 会 发 生 下 面 的 编译 错 


误 . 





error: the trait ‘std::marker::Send. is not implemented for the type ‘std::rc::Rc<st 





因为 Rc 类 型 内 部 的 引用 计数 是 普通 整数 类 型 ， 如 果 多 个 线程 中 分 别 
同时 持 有 指 同 同一 块 内 存 的 Rc 指针 ， 是 线程 不 安全 的 。 这 个 错误 是 通过 
spawn 函 数 的 签名 检查 出 来 的 。spawn 要 求 财 包 参 数 类 型 满足 Send 条 件 ， 
闭 包 是 没有 显 式 impl Send 或 者 Sync 的 ， 按 照 auto trait 的 推理 规则 ， 编 译 
器 会 检查 这 个 类 型 所 有 的 成 员 是 否 满足 Send 或 者 Sync。 目 前 这 个 财 包 参 
数 “捕获 "了 一 个 Rc 类 型 ， 而 Rc 类 型 是 不 满足 Send 条 件 的 ， 因 此 编译 器 推 





于 出 玉 这 个 闲 包 闫 型 是 不 满足 Send 杀 件 的 ， 与 spawn 画 数 的 约束 条 件 发 
了 冲突 。 


查看 源码 我 们 可 以 发 现 ，Rc 和 Arc 这 两 个 类 型 之 间 的 区 别 ， 除 了 引 
用 计数 值 的 类 型 之 外 ， 主 要 如 下 : 





unsafe impl<T: ?Sized + Sync + Send> Send for Arc<T> {} 
unsafe impl<T: ?Sized + Sync + Send> Sync for Arc<T> {} 


impl<T: ?Sized> !marker::Send for Rc<T> {} 
impl<T: ?Sized> !marker::Sync for Rc<T> {} 





编译 器 的 推理 过 程 为 : u32 是 Send， 得 出 Unigue<u32> 是 Send， 接 着 
得 出 Vec<u32> 是 Send， 然 后 得 出 Arc<Vec<u32>> 是 Send， 最 后 得 出 闭 包 
类 型 是 Send。 它 能 够 人 符合 spawn 了 水 数 的 签名 约束 ， 可 以 穿越 线程 边界 。 
如 果 把 共享 变量 类 型 变 成 Cell<u32>， 那 么 Arc<Cell<u32>> 依 然 是 不 符 
合 条 件 的 。 因 为 Cell 类 型 是 不 满足 Sync 的 。 


这 就 是 为 什么 有 愤 气 Rust 给 用 户 提 供 了 两 种 “引用 计数 ”智能 指针 。 
因为 用 户 不 可 能 用 错 。 如 果 不 小 心 把 Rc 用 在 了 多 线程 环境 ， 直 接 是 编译 
错误 ， 根 本 不 会 引发 多 线程 同步 的 问题 。 如 果 不 小 心 把 Arc 用 在 了 单线 
程 环 境 也 没什么 问题 ， 不 会 有 bug 出 现 ， 只 是 引用 计数 增加 或 减少 的 时 
候 效率 稍微 有 一 点 降低 。 














29.2 Mutex 











与 前 面 讲 解 的 Rc 类 似 ， 根 据 Rust 的 “共享 不 可 变 ， 可 变 不 共享 ” 原 
则 ，Arc 既 然 提 供 了 共享 引用 ， 就 一 定 不 能 提供 可 变性 。 所 以 ，Arc 也 是 
只 读 的 ， 它 对 外 API 和 Rc 是 一 致 的 。 如 果 我 们 要 修改 怎么 办 ? 同样 需 
要 “内 部 可 变性 ”"。 当 然 ， 在 多 线程 环境 下 ，Cell 和 RefCell 已 经 不 能 
了 ， 它 们 的 内 部 实现 根本 没 考虑 过 多 线程 的 问题 ， 所 以 它们 不 满足 
Sync。 但 是 没关系 ， 反 正 即使 不 小 心 误 用 了 ， 也 是 编译 错误 。 这 种 时 
候 ， 我 们 需要 用 线程 安全 版 本 的 “内 部 可 变性 ”， 如 Mutex 和 RwLock。 


下 面 我 们 用 一 个 示例 来 演示 一 下 Arc 和 Mutex 配 合 。 使 用 多 线程 修改 


共享 变量 : 





use std::sync::Arc,; 
use std::sync::Mutex; 
use std::thread; 


const COUNT: U32 = 1000000 ; 


fn main() { 
let global = Arc::new(Mutex: :new(0)); 


let clone1 = global.clone(); 
let thread1 = thread::spawn(move|| { 
for _ in ©O..COUNT { 
let mut value = clone1.lock().unwrap(); 
*value += 工 ; 
} 
}); 


let clone2 = global.clone(); 
let thread2 = thread::spawn(move|| { 
for _ in 0O..COUNT { 
let mut value = clone2.1lock().unwrap(); 
*value -= 1; 
} 
}); 


thread1.join().ok(); 
thread2.join().ok(); 
println!("final value: {:?}", global); 





因为 我 们 的 财 包 用 了 move 关 键 字 修饰 ， 为 了 避免 把 global 这 个 引用 
计数 指针 move 进 入 闭 包 ， 所 以 在 外 面 先 提前 复制 一 份 ， 然 后 将 复制 出 
来 的 这 个 指针 传 入 闭 包 中 。 这 样 两 个 线程 就 都 拥有 了 指向 同一 个 变量 的 


Arc 指 针 。 


在 这 个 程序 中 ， 我 们 使 用 两 个 线程 修改 同一 个 整数 : 一 个 线程 对 它 
进行 多 次 加 1， 另 一 个 线程 对 它 进 行 多 次 减 1。 这 次 ， 我 们 使 用 Arc 来 实 
现 多 线程 之 间 的 共享 ， 使 用 Mutex 来 提供 内 部 可 变性 。 每 次 需要 修改 的 
时 候 ， 我 们 需要 调用 lock〈) 方法 〈 或 者 try_lock) 获得 锁 ， 然 后 才能 对 
内 部 的 数据 进行 读 / 写 操作 。 因 为 锁 的 存在 ， 我 们 就 可 以 保证 整个 * 读 / 
写 ” 是 一 个 完整 的 transaction。 对 于 Mutex 类 型 ， 标 准 库 中 有 : 














unsafe impl<T: ?Sized + Send> Send for Mutex<T> { } 
unsafe impl<T: ?Sized + Send> Sync for Mutex<T> { } 





因此 ，Arc<Mutex<isize>> 可 以 满足 Send 要 求 。 


Mutex: : lock() 方法 的 返回 类 型 是 
LockResult<MutexGuard<T>>: 





pub fn lock(&self) -> LockResult<MutexGuard<T>> 





其 中 LockResult 就 是 Result 类 型 的 一 个 别名 ， 是 用 于 错误 处 理 的 : 





type LockResult<Guard> = Result<Guard, PoisonError<Guard>>,; 








如 果 当 前 Mutex 已 经 是 “有 毒 ”(Poison) 的 状态 ， 它 返回 的 就 是 错 
误 。 什 么 情况 会 导致 Mutex 有 毒 昵 ? 当 Mnutex 在 锁 住 的 同时 发 生 了 
panic， 了 驶 会 将 这 个 Mutex 置 为 "有毒 ”的 状态 ， 以 后 再 调用 lock〈) 都 会 
失败 。 这 个 设计 是 为 了 panic safety 而 考虑 的 ， 主 要 就 是 考虑 到 在 锁 住 的 
时 候 发 生 panic 可 能 导致 Mutex 内 部 数据 发 生 混 乱 。 所 以 这 个 设计 防止 再 
次 进入 Mnutex 内 部 的 时 候 访问 了 被 破坏 掉 的 数据 内 容 。 如 果 有 需要 的 
话 ， 用 户 依 然 可 以 手动 调用 PoisonError: : into_inner () 方法 获得 内 部 
数据 。 


而 MutexGuard 类 型 则 是 一 个 “智能 指针 ”类 型 ， 它 实现 了 DerefMut 和 
Deref 这 两 个 trait， 所 以 它 可 以 被 当 作 指 问 内 部 数据 的 普通 指针 使 用 。 
MutexGuard 实 现 了 一 个 析 构 函数 ， 通 过 RAII 手 法 ， 在 析 构 函数 中 调用 了 
unlock() 方法 解锁 。 因 此 ， 用 户 是 不 需要 手动 调用 方法 解锁 的 。 














Mutex 






(Interial mutability ) 








Rust 的 这 个 设计 ， 优 扩 不 在 于 它 “ 人 允许 你 做 什 委 *”; 而 在 于 它 “ 不 公主 
你 做 什么 ”>。 如 果 我 们 误 用 了 Rc<isize> 来 实现 线程 之 间 的 共享 ， 就 是 编 
译 错误 。 根 据 编 译 错误 ， 我 们 将 指针 改 为 Arc 类 型 ， 然 后 又 会 发 现 ， 它 
根本 没有 提供 可 变性 。 它 的 API 只 能 共享 恋 ， 根 本 没有 写 数 据 的 方法 存 
在 。 此 时 ， 我 们 会 想到 加 入 内 部 可 变性 来 允许 多 线程 共享 读 写 。 如 果 我 
们 使 用 了 Arc<RefCell< >> 类 型 ， 依 然 是 编译 错误 。 因 为 RefCell 类 型 不 
满足 Sync。 而 Arc<T> 需 要 内 部 的 T 参 数 必须 满足 T: Sync， 才 能 使 Arc 满 
足 Sync。 把 这 些 综合 起 来 ， 我 们 可 以 推理 出 Arc<RefCell<_>> 是 ! 
9yncC。 


最 终 ， 编 译 右 把 其 他 的 路 都 堵 死 了 ， 唯 一 可 以 编译 通过 的 就 是 使 用 
那些 满足 Sync 条 件 的 类 型 ， 比 如 Arc<Mutex<_>>。 在 使 用 的 时 候 ， 我 们 
也 不 可 能 忘记 调用 lock 方 法 ， 因 为 Mutex 把 真实 数据 包裹 起 来 了 ， 只 有 
调用 lock 方 法 才 有 机 会 访问 内 部 数据 。 我 们 也 不 需要 记得 调用 unlock 方 
法 ， 因 为 lock 方 法 返回 的 是 一 个 MutexGuard 类 型 ， 这 个 类 型 在 析 构 的 时 
候 会 自动 调用 unlock。 


所 以 ， 编 详 器 在 逼 痢 用 户 用 正确 的 方式 写 代 码 。 








29.3 RwLock 


RwLock 就 是 “ 读 写 锁 ?。 它 跟 Mnutex 很 像 ， 主 要 区 别 是 对 外 暴露 的 
API 不 一 样 。 对 Mutex 内 部 的 数据 读 写 ，RwLock 都 是 调用 同样 的 lock 方 
法 ; 而 对 RwLock 内 部 的 数据 读 写 ， 它 分 别提 供 了 一 个 成 员 方 法 
read/write 来 做 这 个 事情 。 其 他 方面 基本 和 Mutex 一 致 。 示 例如 下 : 





use std::sync::Arc; 
use std::sync::RwLock; 
use std::thread; 


const COUNT: U32 = 1000000 ; 


fn main() { 
let global = Arc::new(RwLock: :new(0)); 


let clone1 = global.clone(); 
let thread1 = thread::spawn(move|| { 
for _ in ©O..COUNT { 
let mut value = clonel1.write().unwrap(); 
*value += 工 ; 


}); 


let clone2 = global.clone(); 
let thread2 = thread::spawn(move|| { 
for _ in ©O..COUNT { 
let mut value = clone2.write().unwrap(); 
*value -= 1; 


}); 
thread1.join().ok(); 


thread2.join().ok(); 
println!("final value: {:?}", global); 


4 


29.4 Atomic 


Rust 标 准 库 还 为 我 们 提供 了 一 系列 的 “原子 操作 ”数据 类 型 ， 它 们 在 
std: : sync: : atomic 模 块 里 面 。 它 们 都 是 符合 Sync 的 ， 可 以 在 多 线程 
之 间 共 享 。 比 如 ， 我 们 有 AtomicIsize 类 型 ， 顾 名 思 义 ， 它 对 应 的 是 isize 
类 型 的 “线程 安全 "版 本 。 我 们 知道 ， 普 通 的 整数 读 取 再 写 入 ， 这 种 操作 
是 非 原子 的 。 而 原子 整数 的 特点 是 ， 可 以 把 “ 读 取 ”计算 “再 写 入 ”这 样 
的 操作 编译 为 特殊 的 CPU 指令 ， 保 证 这 个 过 程 是 原子 操作 。 


我 们 来 看 一 个 示例 : 





use std: 
use std: 
use std: 


:Sync: :Arc; 
:Sync::atomic::{AtomicIsize, Ordering}; 
:thread ; 


const COUNT: U32 = 1000000 
fn main() { 


// Atomic 系列 类 型 同样 提供 了 线程 安全 版 本 的 内 部 可 变性 


let 


Jet 
Jet 


}); 


Jet 
Jet 


}); 











global = Arc: :new(AtomicIsize: :new(0)); 


clone1 = global.clone( ); 
thread1 = thread::spawn(move|| { 
for _ in ©O..COUNT { 
clonel1.fetch add(1, Ordering::SeqCst); 
} 


clone2 = global.clone( ); 
thread2 = thread::spawn(move|| { 
for _ in 0O..COUNT { 
clone2.fetch _ sub(1, Ordering::SeqCst); 
} 


thread1.join().ok(); 
thread2.join().ok(); 
println!("final value: {:?}", global); 





这 个 示例 我 们 很 熟悉 : 两 个 线程 修改 同一 个 整数 ， 一 个 线程 对 它 进 
行 多 次 加 1， 妃 外 一 个 线程 对 它 多 次 减 1。 这 次 我 们 发 现 ， 使 用 了 Atomic 
类 型 后 ， 我 们 可 以 保证 最 后 的 执行 结果 一 定 会 回 到 0。 


我 们 还 可 以 把 这 段 代码 改动 一 下 : 











use std::sync::Arc; 
use std::sync::atomic::{AtomicIsize, Ordering}; 
use std::thread; 


const COUNT: U32 = 1000000 ; 


fn main() { 
let global = Arc::new(AtomicIsize: :new(0)); 


let clone1 = global.clone(); 
let thread1 = thread::spawn(move|| { 
for _ in ©O..COUNT { 
let mut value = clone1.load(Ordering::SeqCst); 
Value += 1; 
clonei1.store(value, Ordering::SeqCst); 
} 
}); 


let clone2 = global.clone(); 
let thread2 = thread::spawn(move|| { 
for _ in ©O..COUNT { 
let mut value = clone2.1load(Ordering::SeqCst); 
Value -= 1; 
clone2.store(value, Ordering::SeqCst),; 
} 
}); 


thread1.join().ok(); 
thread2.join().ok(); 
println!("final value: {:?}", global); 








与 上 一 个 版 本 相 比 ， 这 上 段 代 码 的 区 别 在 于 : 我 们 没有 使 用 原子 类 型 
目 己 提供 的 fetch_add fetch_sub 方 法 ， 而 是 使 用 了 load 把 里 面 的 值 读 取出 
来 ， 然 后 执行 加 / 减 ， 操 作 完 成 后 ， 再 用 store 存 储 回 去 。 编 译 程序 我 们 
再 执行 ， 出 现 了 问题 : 这 次 的 执行 结果 就 不 
是 保证 为 0 了 。 


大 家 应 该 很 容易 看 明白 问题 在 哪里 。 原 来 的 那 种 写法 ,“ 读 取 / 计 算 / 
写 入 ”是 一 个 完整 的 “原子 操作 ”， 中 间 不 可 被 打 断 ， 它 是 一 个 “ 事 
务 ”(transaction) 。 而 后 面 的 写法 把 “ 读 取 ”作为 了 一 个 “原子 操作 ”，“ 写 
入 ”又 作为 了 一 个 “原子 操作 >”， 把 一 个 transaction 分 成 了 两 段 来 执行 。 上 
面 的 那个 程序 ， 其 逻辑 类 似 于 “lock=> 读 数据 => 加 / 减 运 算 => 写 数据 
=>unlock”。 下 面 的 程序 ， 其 逻辑 类 似 于 “lock=> 读 数据 =>unlock=> 加 / 减 
运算 =>lock=> 写 数据 =>unlock”。 昌 然 每 次 读 写 共享 变量 都 保证 了 唯一 
性 ， 但 逻辑 还 是 错 的 。 


所 以 ， 编 译 器 只 能 防止 基本 的 数据 竞争 问题 。 如 果 程 序 里 面 有 逻辑 


错误 ， 工 具 是 没有 办 法 帮 我 们 发 现 的 。 上 面 这 个 示例 中 并 不 存在 数据 竞 
争 问 题 ， 是 完全 的 “业务 逻辑 bug”。 


29.5 和 死 锁 


既然 Rust 中 提供 了 “ 锁 ” 机 制 ， 那 么 Rust 中 是 否 有 可 能 出 现 “ 死 锁 ” 的 
现象 呢 ? 我 们 用 经 典 的 “哲学 家 就 餐 问题 ”来 演示 一 下 。 


问题 : 假设 有 5 个 哲学 家 ， 共 享 一 张 放 有 5 把 椅子 的 果子 ， 每 人 分 } 得 
把 椅子 ， 但 是 ， 虹 子 上 共有 5 文人 筷子 ， 在 每 人 两 边 各 放 一 文 ， 并 学 家 
们 在 肚子 饥饿 时 才 试 图 分 两 次 从 两 边 拿 起 筑 子 就 餐 。 

未 什 ; 

' 拿 到 两 支 合 子 时 哲学 家 才 开 始 吃饭 ; 


如 果 生 子 已 在 他 人 竹 上 ， 则 该 有 学 家 必须 等 他 人 吃 完 之 后 才能 
到 生子 ; 


任 一 哲学 家 在 自己 未 拿 到 两 只 筷子 前 却 不 放下 自己 手中 的 筷子 。 
代码 如 下 : 

















use std::thread; 
use std::sync::{Mutex, Arc}; 
use std::time::Duration; 


struct Philosopher { 
name: String, 
left: usize, 
right: usize, 


impl Philosopher { 
fn new(name: &str, left: usize, right: usize) -> Philosopher { 
Philosopher { 
name: name.to_string(), 
left: left, 
right: right, 


fn eat(&self, table: &Table) { 
let _left = table.forks[self.]left].1lock().unwrap(); 
println!("{} take left fork.", self.name); 
thread: :sleep(Duration: :from_ secs(2)); 
let _right = table.forks[self.right].1lock().unwrap(); 


println!("{} take right fork.", self.name); 
thread::SJeep(Duration: :from_ secs(1)); 
println!("{} is done eating.", self.name); 


} 


struct Table { 
forks: Vec<Mutex<()>>, 
} 


fn main() { 

let table = Arc::new(Table { forks: vecl[ 
Mutex: :new( ()), 

Mutex: :new( 

Mutex: :new( 

Mutex: :new( 

Mutex: :new( 


]}); 


let philosophers = vec![ 
Philosopher::new("Judith Butler", 0, 1), 
Philosopher: :new("Gilles Deleuze", 1, 2), 
Philosopher::new("Karl Marx", 2, 3), 
Philosopher::new("Emma Goldman", 3, 4), 
Philosopher::new("Michel] Foucault", 4, 0), 
]; 


let handles: Vec< > = philosophers.into_iter().map(|p| { 
let table = table.clone(); 


thread::spawn(move || { 
p.eat(&table); 
}) 


}).collect(); 
for h in handles { 
h.join().unwrap(); 





编译 执行 ， 我 们 可 以 发 现 ，5 个 哲学 家 都 拿 到 了 他 左边 的 那 支 秘 
子 ， 而 都 在 等 待 他 右边 的 那 支 筷子 。 在 没 等 到 右边 筷子 的 时 候 ， 每 个 人 
都 不 会 释放 自己 已 经 拿 到 的 那 支 筷子 。 于 是 ， 大 家 都 进入 了 无 限 的 等 待 
之 中 ， 程 序 无 法 继续 执行 了 。 这 就 是 “ 死 锁 ”。 


在 Rust 中 ,，“ 死 锁 * 问 题 是 没有 办 法 在 编 详 阶 段 由 前 态 检 查 来 解决 
的 。 束 像 前 面 提 到 的 “循环 引用 制造 内 存 泄 涯 一样， 编译 右 无 法 通过 译 
态 检查 来 完全 避免 这 个 问题 ， 需 要 程序 员 上 自己 注意 。 











29.6 Barrier 


除了 “ 锁 ” 之 外 ，Rust 标 准 库 还 提供 了 一 些 其 他 线程 之 间 的 通信 方 
式 ， 比 如 Barrier 等 。Barrier 是 这 样 的 一 个 类 型 ， 它 使 用 一 个 整数 做 初始 
化 ， 可 以 使 得 多 个 线程 在 某 个 点 上 一 起 等 待 ， 然 后 再 继续 执行 。 示 例如 
下 : 





use std::sync::{Arc, Barrier}; 
use std::thread; 


fn main() { 
let barrier = Arc::new(Barrier::new(10)); 
let mut handlers = vec![]; 
for _ in 0..10 { 
let c = barrier.clone(); 
// The same messages will be printed together. 
// You will NOT see any interleaving. 
let t = thread::spawn(move|| { 
println!("before wait"); 
c.wait(); 
println!("after wait"); 


}); 
handlers.push(t); 


for h in handlers { 
h.join().ok(); 





这 个 程序 创建 了 一 个 多 个 线程 之 间 共 享 的 Barrier， 它 的 初始 值 是 
10。 我 们 创建 了 10 个 子 线程 ， 每 个 子 线程 都 有 一 个 Arc 指 针 指 同 了 这 个 
Barrier， 并 在 子 线程 中 调用 了 Barrier: : wait 方 法 。 这 些 子 线程 执行 到 
wait 方 法 的 时 候 ， 就 开始 进入 等 竺 状态， 一 直到 wait 方 法 被 调用 了 10 
次 ，10 个 子 线程 都 进入 等 待 状态 ， 此 时 Barrier 就 通知 这 些 线程 可 以 继续 
了 。 然 后 它们 再 开始 执行 下 面 的 逻辑 。 


所 以 最 终 的 执行 结果 是 : 先 打 印 出 10 条 before wait， 再 打印 出 10 条 
after wait， 绝 不 会 错乱 。 如 果 我 们 把 c.wait () 这 条 语句 删除 掉 可 以 看 
到 ， 执 行 结果 中 ，before wait 和 after wait 是 混杂 在 一 起 的 。 





29.7 Condvar 





Condvar 是 条 件 变量 ， 它 可 以 用 于 等 待 某 个 事件 的 发 生 。 在 等 待 的 
时 候 ， 这 个 线程 处 于 阻塞 状态 ， 并 不 消耗 CPU 资源 。 在 第 见 的 操作 系统 
上 ，Condvar 的 内 部 实现 是 调用 的 操作 系统 提供 的 条 件 变量 。 它 调用 wait 
方法 的 时 候 需 要 一 个 MutexGuard 类 型 的 参数 ， 因 此 Condvar 总 是 与 Mutex 
配合 使 用 的 。 而 且 我 们 一 定 要 注意 ， 一 个 Condvar 应 该 总 是 对 应 一 个 
Mutex， 不 可 混用 ， 否 则 会 导致 执行 阶段 的 panic。 


Condvar 的 一 个 常见 使 用 模式 是 和 一 个 Mutex<bool> 类 型 结合 使 用 。 
我 们 可 以 用 Mutex 中 的 bool 变 量 存储 一 个 旧 的 状态 ， 在 条 件 发 生 改 变 的 
时 候 修 改 它 的 状态 。 通 过 这 个 状态 值 ， 我 们 可 以 决定 是 否 需 要 执行 等 待 
事件 的 操作 。 示 例如 下 : 




















use std::sync::{Arc, Mutex, Condvar}; 

use std::thread; 

use std::time::Duration; 

fn main() { 
let pair = Arc::new((Mutex: :new(false), Condvar::new())); 
let pair2 = pair.clone(); 


thread::spawn(move|| { 
thread: :sleep(Duration: :from secs(1)); 
let &(ref lock, ref cvar) = &*pair2; 
let mut started = lock.lock().unwrap(); 
*started = true; 
cvar .notify_one(); 
println!("child thread {}", *started); 
}); 


// wait for the thread to start up 
let &(ref lock, ref cvar) = &*pair,; 
let mut started = lock.lock().unwrap(); 


println!("before wait {}", *started); 
while !*started { 
started = cvar.wait(started).unwrap(); 


println!("after wait {}", *started),; 





这 段 代 码 中 存在 两 个 线程 之 间 的 共享 变量 ， 包 括 一 个 Condvar 和 一 
个 Mutex 封 装 起 来 的 bool 类 型 。 我 们 用 Arc 类 型 把 它们 包 起 来 。 在 子 线程 
中 ， 我 们 做 完了 某 件 工 作 之 后 ， 束 将 共享 的 bool 类 型 变量 设置 为 true， 





并 使 用 Condvar: : notify_one 通 知事 件 发 生 。 


在 主线 程 中 ， 我 们 首先 判定 这 个 bool 变 量 是 侣 为 tue: 如 采 已 经 是 
true， 那 就 没 必 要 进入 等 待 状态 了 ; 否 则 ， 就 进入 阻 窟 状态 ， 等 待 子 线 
程 完 成 任务 。 


29.8 全 局 变量 


Rust 中 人 允许 存在 全 局 变量 。 在 基本 语法 章节 讲 过 ， 使 用 static 关 键 字 
修饰 的 变量 就 是 全 局 变量 。 全 局 变量 有 一 个 特点 : 如 果 要 修改 全 局 变 
量 ， 必 须 使 用 unsafe 关 键 字 : 























static mut G: i32 = 1; 


fn main() { 
G = 2; 
} 








编译 ， 可 见 错误 信息 为 : 





error[E0133]: use of mutable static requires unsafe function or block 








这 个 规定 显然 是 有 助 于 线程 安全 的 。 如 果 允 许 任 何 函 数 可 以 随便 读 
写 全 局 变量 的 话 ， 线 程 安 全 就 无 从 谈 起 了 。 只 有 不 用 mut 修 饰 的 全 局 变 
量 才 是 安全 的 ， 因 为 它 只 能 被 读 取 ， 不 能 被 修改 。 


我 们 又 可 以 想到 ， 有 些 类 型 的 变量 不 用 mnut 修 饰 ， 也 是 可 以 做 修改 
的 。 比 如 具备 内 部 可 变性 的 Cell 等 类 型 。 我 们 可 以 试验 一 下 ， 如 果 有 一 
个 全 局 的 、 有 具备 内 部 可 变性 的 变量 ， 会 发 生 什 么 情况 : 





#![feature(const_fn)] 
use std::cell::Cell; 
use std::thread; 


static G: Cell<i32> = Cell: :new(1); 


fn f1() { 
G.set(2); 


fn f2() { 
G.set(3); 


fn main() { 
thread: :spawn( 
thread: :spawn( 


} 








试 着 编译 一 下 上 面 这 个 例子 ， 可 见 编译 错误 为 ; 





error[E0277]: the trait bound ‘std::cell::Cell<i32>: std::marker::Sync is not Satis 
--> test.rs:5:1 
| 
5 | static G: Cell<i32> = Cell::new(1); 
| AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 人 人 “std:'':'cell'::Cell<i32>. cannot be shared be 
| 
= help: the trait ‘std::marker::Sync is not implemented for ‘std::cell:: Cell<j 
= note: shared static variables must have a type that implements ‘Sync. 








对 于 上 面 这 个 例子 ， 我 们 可 以 推理 一 下 ， 现 在 有 两 个 线程 同时 修改 
一 个 全 局 变量 ， 而 且 修改 过 程 没 有 做 任何 线程 同步 ， 这 里 肯定 是 有 线程 
安全 的 问题 。 但 是 ， 注 意 这 里 传递 给 spawn 函 数 的 闭 包 ， 实 际 上 没有 捕 
获 任何 局 部 变量 ， 所 以 ， 它 是 满足 Send 条 件 的 。 在 这 种 情况 下， 线程 不 
安全 类 型 并 没有 直接 罕 越 线程 的 边界 ，spawn 冰 数 这 里 指定 的 约束 条 件 
古 查 不 出 问题 来 的 。 


但 是 ， 编 详 占 还 设置 了 力 外 一 条 规则 ， 即 共 圣 叉 可 变 的 全 局 变量 必 
须 满足 Sync 约束 。 根 据 Sync 的 定义 ， 满 足 这 个 条 件 的 全 局 变量 显然 是 线 
程 安全 的 。 因 此 ， 编 译 器 把 这 条 路 也 堵 死 了 ， 我 们 不 可 以 简单 地 通过 全 
局 变量 共 孚 状态 来 构造 出 线程 不 安全 的 行为 。 对 于 那些 满足 Sync 条 件 且 
具备 内 部 可 变性 的 类 型 ， 比 如 Atomic 系 列 类 型 ， 作 为 全 局 变量 共享 是 完 
全 安全 且 合 法 的 。 












































29.9 ”线程 局 部 存储 


线程 局 部 《Thread Local) 的 意思 是 ， 声 明 的 这 个 变量 看 起 来 是 一 
不 要 量 ; 但 实际 上 在 得 一 个 线程 中 分 别 有 目 己 独 立 的 三 储 地 址 ， 是 不 
同 的 变量 ， 互 不 干扰 。 在 不 同 线程 中 ， 只 能 看 到 与 当前 线程 相关 联 的 那 
个 副本 ， 因 此 对 它 的 读 写 无 须 考 虑 线程 安全 问题 。 


在 Rust 中 ， 线 程 独立 存储 有 两 种 使 用 方式 。 

可 以 使 用 #[thread_locallattribute 来 实现 。 这 个 功能 目前 在 稳定 版 中 
还 不 文 持 ， 只 能 在 nightly 版 本 中 开启 #1! [feature (thread_local) ] 功 能 
能 使 用 。 


:可 以 使 用 thread_local! 宏 来 实现 。 这 个 功能 已 经 在 稳定 版 中 获得 
支持 。 


示例 如 下 : 














use std::cell::RefCell; 
use std::thread; 


fn main() { 


thread_ locall!{ 
static FOO: RefCell<u32> = RefCell: :new(1) 
}; 


FOO.with(|f| { 
println!("main thread valuel1 {:?}", *f.borrow()); 
*f.borrow_ mut() = 2; 
println!("main thread value2 {:?}", *f.borrow()); 


}); 


let t = thread::spawn(move|| { 
FOO.with(|f| 区 
println!("child thread valuel1 {:?}", *f.borrow()); 
*f.borrow_mut() = 3; 
println!("child thread Value2 {:?}", *f.borrow()); 
}); 


}); 
t.join().ok(); 


FOO.with(|f| { 
println!("main thread value3 {:?}", *f.borrow()); 


}); 


用 thread_local! 声明 的 变量 ， 使 用 的 时 候 要 用 with《〈) 方法 加 闭 包 
来 完成 。 以 上 代码 编译 、 执 行 的 结果 为 : 





main thread Valuel 1 
main thread Value2 2 
child thread value1 1 
child thread value2 3 
main thread value3 2 





我 们 可 以 看 到 ， 在 主线 程 中 将 FOO 的 值 修改 为 2， 但 是 进入 子 线程 
后 ， 它 看 到 的 初始 值 依然 是 1。 在 子 线程 将 FOO 的 值 修改 为 3 之 后 回 到 主 
线程 ， 主 线程 看 到 的 值 还 是 2。 


这 说 明 ， 在 子 线程 中 和 主线 程 中 看 到 的 FOO 其 实 是 两 个 完全 独立 的 
变量 ， 互 不 影响 。 








29.10 “总结 


从 前 面 的 分 析 可 见 ，Rnust 的 设计 一 方面 茶 止 了 我 们 在 线程 之 间 随 意 
共 孚 变量 ， 妃 一 方面 提供 了 一 些 工 具 类 型 供 我 们 使 用 ， 使 我 们 可 以 安全 
地 在 线程 之 间 共 部 变量 。 这 既 提 供 了 完整 的 功能 ， 又 避免 了 数据 竞争 一 
类 的 bug。Rnust 之 所 以 这 么 设计 ， 是 因为 设计 者 观察 到 了 发 生 “ 数 据 竞 
争 ” 的 根源 是 什么 。 简 单 总 结 就 是 : 


Aljias+Mutation+No ordering 


实际 上 我 们 可 以 看 到 ，Rust 保 证 内 存 安全 的 思路 和 线程 安全 的 思路 
J 在 多 线程 中 ， 我 们 要 保证 没有 数据 竞争 ， 一 般 是 通过 下 面 的 
方式 : 


(1) 多 个 线程 可 以 同时 读 共 储 变 量 ; 


享 
(2) 只 要 存在 一 个 线程 在 写 共 享 变量 ， 则 不 允许 其 他 线程 读 / 写 共 
党 变量。 


这 是 不 是 与 第 二 部 分 讲 的 “内 存 安全 ”的 模型 一 模 一 样 ? 这 两 个 设计 
实际 上 古 一 脉 相 承 的 。 如 果 没 有 “默认 内 存 安全 ”打下 的 展 好 基础 ，Rust 
就 没 办 法 做 到 “线程 安全 ”， 正 因为 在 “内 存 安全 ”问题 上 的 一 系列 基础 性 
设计 ， 才 导致 了 “线程 安全 ”基本 就 是 水 到 渠 成 的 结果 。 我 们 甚至 可 以 观 
0 比 
0: 











向 














(1) Rc 是 非 线程 安全 的 ，Arc 则 是 与 它 对 应 的 线程 安全 版 本 。 妆 然 
还 有 弱 指针 Weak 也 是 一 一 对 应 的 。Rc 无 须 考 虑 多 线程 场景 下 的 问题 ， 
因此 它 内 部 只 需 普 通 整 数 做 引用 计数 即 可 。Arc 要 用 在 多 线程 场景 ， 
此 它 内 部 必须 使 用 “原子 整数 ”来 做 引用 计数 。 


(2) RefCell] 是 非 线 程 安 全 的 ， 它 不 能 在 路 线程 场景 使 用 。 
Mutex/RwLock 则 是 与 它 相 对 应 的 线程 安全 版 本 。 它 们 都 提供 了 “内 部 可 
变性 >”，RefCell 无 须 考 虑 多 线程 问题 ， 所 以 它 内 部 只 需 一 个 普通 整数 做 
借用 计数 即 可 。Mutex/RwLock 可 以 用 在 多 线程 环境 ， 所 以 它们 内 部 需 
要 使 用 操作 系统 提供 的 原 语 来 完成 * 锁 功能。 它们 有 相似 之 处 ， 也 有 不 











同 之 处 。Mutex/RwLock 在 加 锁 的 时 候 返 回 的 是 Result 类 型 ， 是 因为 它们 
需要 考虑 “异常 安全 ”问题 一 一 在 多 线程 环境 下 ， 很 可 能 出 现 一 个 线程 发 
生 了 panic， 导 致 Mutex 内 部 的 数据 已 经 被 破坏 ， 而 在 另外 一 个 线程 中 依 
然 有 可 能 观察 到 这 个 被 破坏 的 数据 结构 。RefCell 则 相对 简单 ， 只 需 考 虑 
AssertUnwindSafe 即 可 。 


(3) Cell 是 非 线程 安全 的 ，Atomic* 系 列 类 型 则 是 与 它 对 应 的 线程 
安全 版 本 。 它 们 之 间 的 相似 之 处 在 于 ， 都 提供 了 “内 部 可 变性 ”， 而 且 都 
不 提供 指向 内 部 数据 的 方法 。 它 们 对 内 部 数据 的 读 写 ， 都 是 整体 读 出 、 
整体 写 入 ， 不 可 能 制造 出 直接 指向 内 部 数据 的 指针 。 它 们 的 不 同 之 处 在 
于 ，Cell 的 条 件 更 宽松 。 而 标准 库 提供 的 Atomic* 系 列 类 型 则 受 限 于 CPU 
提供 的 原子 指令 ， 内 部 存储 的 数据 类 型 是 有 限 的 ， 无 法 推广 到 所 有 类 
型 。 其 实 我 们 完全 可 以 仿造 Cell 类 型 ， 设 计 一 个 可 以 应 用 于 所 有 类 型 的 
通用 型 Atomic<T> 类 型 内 部 用 Mutex 实 现 ， 提 供 get/set 方 法 作为 对 外 
API。 这 个 尝试 已 经 在 第 三 方 开 源 库 中 实现 ， 如 需 了 解 ， 上 GitHub 搜 
索 “atomic-rs” 即 可 。 


Rust 的 这 套 线 程 安 全 设计 有 以 下 好 处 : 
-免疫 一 切 数据 竞争 

:无 额外 性 能 损耗 ; 
-无须 与 编译 占 紧 灯 合 。 


我 们 可 以 观察 到 一 个 有 趣 的 现象 ;Rust 语言 实际 上 并 不 知晓 “ 线 
程 ” 这 个 概念 ， 相 关 类 型 都 是 写 在 标准 库 中 的 ， 与 其 他 类 型 并 无 二 致 。 
Rnust 语 言 提 供 的 仅仅 只 是 Sync、Send 这 样 的 一 般 性 概念 ， 以 及 生命 周期 
分 析 、“borrow check” 分 析 这 样 的 机 制 。Rust 编 译 嚣 本 里 并 未 与 “线程 安 
全 ”数据 竞争 ”等 概念 深度 绑 定 ， 也 不 需要 一 个 runtime 来 辅助 完成 功 
能 。 然 而 ， 通 过 这 些 基 本 概念 和 机 制 ， 它 却 实现 了 完全 通过 编译 阶段 静 
0 目标 。 这 样 的 设计 正 是 Rust 的 魅力 所 
士 。 


























正 因为 解 耘 合 如 此 彻底 ，Rust 语 言 才 会 如 此 精简 ， 它 只 提供 了 非常 
基本 的 并 行 开发 相关 的 基本 抽象 。 而 且 标 准 库 中 实现 的 这 些 基本 功能 ， 
其 实 都 可 以 完全 由 第 三 方 来 实现 。 理 论 上 来 讲 ， 其 他 语言 中 出 现 了 的 更 
高 级 的 并 行程 序 开发 的 抽象 机 制 ， 一 般 都 可 以 通过 第 三 方 库 的 方式 来 提 

















供 ， 没 必要 与 Rust 编 译 器 深度 绑 定 。 在 下 一 章 中 ， 我 们 再 来 介绍 一 些 更 
高 级 的 并 行 开发 模式 ， 它 们 都 由 第 三 方 库 来 实现 ， 无 须 编 译 器 特殊 文 


持 。 


第 30 间 ”管道 


在 上 一 章 中 ， 我 们 主要 讲述 了 如 何在 多 线程 中 共享 变量 。Rust 标 准 
库 中 还 提供 了 另外 一 种 线程 之 间 的 通信 方式 ，mpsc。 这 部 分 的 库存 储 在 
std: : sync: : mpsc 这 个 模块 中 。mpsc 代 表 的 是 Multi-producer，single- 
consumer FIFO queue， 即 多 生产 者 单 消 费 者 先进 先 出 队列 。 这 种 线程 之 
间 的 通信 方式 是 在 不 同 线程 之 间 建 立 一 个 通信 “管道 ”(channel) ， 一 边 
发 送 消息 ， 一 边 接收 消息 ， 完 成 信息 交流 。 

















Do not communicate by sharing memory; instead，share memory by 
communicating. 


一 -一 Effective Go 


既然 共享 数据 存在 很 多 朵 烦 ， 那 在 茶 些 场景 下 ， 用 发 消息 的 方式 完 
成 线程 之 间 的 通信 是 更 合适 的 选择 。 














30.1 腊 步 管道 








异步 管道 是 最 第 用 的 一 种 管道 类 型 。 它 的 特点 是 :发送 端 和 接收 站 
之 间 存 在 一 个 绥 冲 区 ， 发 送 端 友 送 数 据 的 时 候 ， 是 先 将 这 个 数据 扔 到 组 
冲 区 ， 再 由 接收 端 目 己 去 取 。 因 此 ， 每 次 有 发送， 立马 就 返回 了 ， 人 发送 端 
不 用 管 数据 什么 时 候 被 接收 端 处 理 。 


我 们 先 用 一 个 简单 示例 来 演示 一 下 管道 的 基本 用 法 : 








use std::thread; 
use std::sync::mpsc::channel,; 


fn main() { 
let (tx, rx) = channel(); 
thread::spawn(move|| { 
for i in 0..10 
tx.send(i).unwrap(); 


}); 


while let Ok(r) = rx.recv() { 
println!("received {}", r); 
} 


} 





Os 我 们 首先 创建 了 一 个 管道 。channel 函 数 的 签名 是 这 





pub fn channel<T>() -> (Sender<T>, Receiver<T>) 





它 返 回 了 一 个 tuple， 里 面包 括 一 个 太 送 者 (Sender) 和 一 个 接收 者 


(Receiver) 。 


接 下 来 我 们 创建 一 个 子 线程 ， 然 后 将 这 个 发 送 者 move 进 入 了 子 线 


子 线程 中 的 发 送 者 不 断 循环 调 用 send 方 法 ， 发 送 数据 。 在 主线 程 
中 ， 我 们 使 用 接收 者 不 断 调 用 recv 方 法 接收 数据 。 


我 们 可 以 注意 到 ，channel () 是 一 个 泛 型 函数 ，Sender 和 Receiver 


都 是 泛 型 类 型 ， 且 一 组 发 送 者 和 接收 者 必定 是 同样 的 类 型 参数 ， 因 此 保 
证 了 发 送 和 接收 端 都 是 同样 的 类 型 。 因 为 Rust 中 的 类 型 推导 功能 的 存 
在 ， 使 我 们 可 以 在 调用 channel 的 时 候 不 指定 具体 类 型 参数 ， 而 通过 后 续 
的 方法 调用 ， 推 导出 正确 的 类 型 参数 。 


Sender 和 Receiver 的 泛 型 参数 必须 满足 T: Send 约 束 。 这 个 条 件 是 显 
而 易 见 的 : 被 发 送 的 消息 会 从 一 个 线程 转移 到 另外 一 个 线程 ， 这 个 约束 
是 为 了 满足 线程 安全 。 如 果 用 户 指定 的 泛 型 参数 没有 满足 条 件 ， 在 编译 
的 时 候 会 发 生 错 误 ， 提 醒 我 们 修复 bug。 


发 送 者 调用 send 方 法 ， 接 收 者 调用 recv 方 法 ， 返 回 类 型 都 是 Result 类 
型 ， 用 于 错误 处 理 ， 因 为 它们 都 有 可 能 调用 失败 。 当 发 送 者 已 经 被 销毁 
的 时 候 ， 接 收 者 调用 recv 则 会 返回 错误 ; 同样 ， 当 接收 者 已 经 销毁 的 时 
候 ， 发 送 者 调用 send 也 会 返回 错误 。 


在 管道 的 接收 端 ， 如 果 调 用 recv 方 法 的 时 候 还 没有 数据 ， 它 会 进入 
等 竺 状态 阻 竖 当前 线程 ， 直 到 接收 到 数据 才 继 续 往 下 执行 。 


管道 还 可 以 是 多 发 送 端 单 接收 端 。 做 法 很 简单 ， 只 需 将 发 送 端 
Sender 复 制 多 份 即 可 。 复 制 方式 是 调用 Sender 类 型 的 clone 〈) 方法 。 这 
个 库 不 支持 多 接收 端的 设计 ， 因 此 Receiver 类 型 没有 clone 〈) 方法 。 在 
上 例 的 基础 上 我 们 稍 做 改动 ， 创 建 多 个 线程 ， 每 个 线程 发 送 一 个 数据 到 
接收 端 。 代 人 码 如 下 : 




















use std::thread; 
use std::sync::mpsc::channel,; 


fn main() { 
let (tx, rx) = channel(); 


for i in 0..10 { 
let tx = tx.clone(); // 复制 一 个 新 的 tx, 将 这 个 复制 的 变量 move 进入 子 线程 
thread: :spawn(move|| { 
tx.send(i).unwrap(); 




















} 
drop(tx); 


while let Ok(r) = rx.recv() { 
println!("received {}", r); 








以 上 代码 编译 执行 ， 可 以 发 现 它 打印 的 结果 与 前 面 的 例子 不 同 了 。 


在 前 面 示例 中 ， 这 些 数字 呈 顺 序 排列 ， 因 为 发 送 端 是 按 顺 序 发 送 的 ， 接 
收 闯 会 保持 同样 的 顺序 。 但 在 这 个 示例 中 ， 这 些 数字 呈 乱 序 排列 ， 因 为 
它们 来 自 不 同 的 线程 ， 哪 个 先 执 行 哪个 后 执行 并 不 是 确定 的 ， 取 决 于 操 
作 系 统 的 调度 。 


目前 我 们 用 的 这 个 管道 是 “异步 2 的， 标准 库 还 提供 了 另外 一 种 “ 同 
步 ” 管 道 供 我 们 使 用 。 同 步 省 道 和 和 异步 管道 在 接收 端 是 一 样 的 逻辑 ， 区 
别 在 于 发 送 端 。 





30.2 同步 管道 





异步 管道 内 部 有 一 个 不 限 长 度 的 缓冲 区 ， 可 以 一 直 往 里 面 填充 数 
据 ， 直 至 内 存 资 源 耗 尽 。 人 
蹇 ， 只 要 把 消 妃 加 入 到 缓冲 区 ， 它 束 马 上 返 


同步 管道 的 特点 是 : 其 内 部 有 一 个 固定 大 小 的 缓冲 区 ， 用 来 缓存 消 

， 如 果 缓冲 区 被 填 满 了 ， 继 续 调用 send 方 法 的 时 候 会 发 生 阻塞 ， 等 竺 
读 认 骨 把 缓冲 区 内 的 消息 拿 走 才 能 继续 发 送 。 绥 冲 区 的 长 度 可 以 在 建立 
管道 的 时 候 设 置 ， 而 且 0 是 有 效 数 值 。 如 采 绥 冲 区 的 长 度 设置 为 0， 那 惑 
意味 着 每 次 的 发 送 操作 都 会 进入 等 竺 状态， 直到 这 个 消息 被 接收 端 取 走 
才能 返回 。 示 例如 下 : 





use std::thread; 
use std::sync::mpsc::sync_channel; 


fn main() { 
let (tx, rx) = sync_channel(1); 
tx.send(1).unwrap(); 
println!("send first"); 
thread::spawn(move|| { 
tx.send(2).unwrap(); 
println!("send second"); 


}); 


println!("receive first {}", rx.recv().unwrap()); 
println!("receive Second {}", rx.recv().unwrap()); 





我 们 可 以 看 到 ， 程 序 执行 结果 永远 是 : 发 送 一 个 并 接收 一 个 之 后 ， 
才 会 出 现 发 送 第 二 个 接收 第 二 个 。 


我 们 讲 的 这 两 种 管道 都 是 单 问 通信 ， 一 个 发 送 一 个 接收 ， 不 能 
来 。 Rust 没 有 在 标准 库 中 实现 官 道 双 问 通 信 。 双 加 管道 也 不 是 不 可 能 
的 ， 在 第 三 方 库 中 已经 有 了 实现 。 














第 31 章 ”第 三 方 并 行 开发 库 


在 前 面 的 章节 中 ， 我 们 介绍 了 Rust 标 准 库 提 供 的 多 线程 相关 工具 。 
相 比 于 当下 许多 流行 的 编程 语言 ，Rust 标 准 库 的 设计 是 属于 比较 基础 、 
比较 原始 的 。 但 是 ，Rust 在 线程 安全 方面 的 设计 上 共有 非常 好 的 扩展 性 ， 
包括 标准 库 在 内 的 很 多 实现 并 没有 与 编译 需 深 度 绑 定 。 很 多 高 级 的 抽象 
都 可 以 通过 第 三 方 库 的 方式 提供 。 而 且 ， 只 要 设计 合理 ， 高 质量 的 第 三 
方 库 可 以 拥有 和 标准 库 同 样 的 “线程 安全 ”特性 。 


本 章 就 挑选 一 些 社 区 内 评价 较 高 的 并 行 开发 方面 的 库 ， 做 简单 介 

















绍 。 


31.1 threadpool 


threadpool 是 一 个 基本 的 线程 池 实 现 。 在 标准 库 中 ， 我 们 可 以 用 
std: : thread: : spawn() 方法 创建 新 线程 。 而 这 个 库 可 以 让 我 们 指 
它 上 自动 将 每 个 任务 分 配 到 线程 中 去 执行 。 使 用 
方法 如 下 : 





use threadpool::ThreadPool; 
use std::sync::mpsc::channel,; 


fn main() { 
let n_ workers = 4; 
let n_jobs = 8; 
let pool = ThreadPool::new(n_workers); 


let (tx, rx) = channel(); 
for _ in 0..n_jobs { 
let tx = tx.clone(); 
pool.execute(move|| { 
tx.send(1).expect("channel will be there waiting for the pool"); 
}); 
} 


assert eq!(rx.iter().take(n_jobs).fold(0, |a, bl a + b), 8); 





ThreadPool: : execute 与 std: : thread: : spawn 的 区 别 就 是 ， 它 需 
要 先 创 建 一 个 对 象 ， 然 后 调用 : execute 方 法 ， 其 他 都 差不多 。 


31.2 scoped-threadpool 





在 前 面 的 章节 中 ， 我 们 已 经 知道 ， 如 果 要 在 多 线程 之 间 共 享 变量 ， 
必须 使 用 Arc 这 样 的 保证 线程 安全 的 智能 指针 。 然 而 ，Arc 是 有 运行 期 开 
销 的 (虽然 很 小 ) 。 假 如 我 们 有 时 候 需 要 子 线程 访问 当前 调用 栈 中 的 局 
部 变量 ， 而 且 能 保证 当前 函数 的 生命 周期 一 2 周期， 
子 线 程 一 定 先 于 当前 函数 退出 ， 那 我 们 能 不 能 直接 在 子 线 程 中 使 用 最 简 
单 的 借用 指针 && 来 访问 父 线程 栈 上 的 局 部 对 象 昵 ? 


至 少 标 准 库 中 的 spawn 函 数 是 不 行 的 。spawn 的 签名 是 : 























pub fn spawn<F, T>(f: F) -> JoinHandle<T> 
where F: Fnonce() -> T, F: Send + 'static, T: Send + 'static 








注意 这 里 的 闭 包 要 满足 f，'static 约 束 。 这 意味 着 闭 包 中 存在 不 能 捕 
获 短 生命 周期 的 变量 ， 比 如 指 回 当前 局 部 调用 栈 的 指针 。 这 是 因为 
财 包 传递 给 一 个 新 的 子 线程 ， 这 个 子 线程 的 生命 周期 很 
能 大 于 当前 函数 调用 生命 周期 。 如 果 我 们 希望 在 子 线程 中 访问 当前 函 
数 中 的 局 部 变量 ， 怎 么 办 呢 ? 可 以 使 用 第 三 方 库 scoped_threadpool。 我 
们 来 看 看 scoped_threadpool 是 如 何 使 用 的 : 








extern crate scoped_ threadpool; 
use scoped_ threadpool::Pool; 


fn main() { 
let mut pool = Pool: :new(4); 


let mut vec = vec![90, 1, 2, 3, 4, 5, 6, 7]; 
pool.scoped(|scope| { 
for e in &mut vec 


SR execute(move || { 
*e += 工 ; 
}); 


} 
}); 


println!("{:?}", vec); 





在 这 里 ， 线 程 内 部 直接 使 用 了 &mnut vec 形 式 访问 了 父 线程 “ 栈 ”* 上 的 


变量 ， 而 不 必 使 用 Arc。 我 们 可 以 注意 到 ，scoped 方 法 的 签名 是 这 样 
的 : 





fn scoped<'pool, 'scope, F, R>(&'pool mut self, f: F) -> R 
where F: FnOonce(&Scope<'pool, 'scope>) -> R 





这 里 ， 参 数 闭 包 的 约束 条 件 没有 'static 这 一 项 。 所 以 我 们 上 面 的 调 
用 是 可 以 成 功 的 。scoped_threadpool 库 的 源码 并 不 复杂 ， 只 需 一 个 文件 
即 可 ， 各 位 读者 可 以 自己 去 GitHub 上 阅读 它 的 源码 ， 看 看 它 是 怎么 实现 
的 。 


31.3 parking_lot 


Rust 标 准 库 帮 我 们 封装 了 一 些 基 本 的 操作 系统 的 同步 原 语 ， 比 如 
Mutex Condvar 等 。 一 般 情 况 下 这 些 够 我 们 使 用 了 。 但 是 还 有 一 些 对 性 
能 有 极致 要 求 的 开发 者 对 标准 库 的 实现 并 不 满意 ， 于 是 社区 里 又 有 人 开 
发 出 来 了 一 套 蔡 代 品 ， 在 性 能 和 易 用 性 方面 ， 都 比 标准 库 更 好 ， 这 就 是 
parking_lot 库 。 下 面 的 示例 展示 了 这 个 库 提供 的 Mutex， 它 的 用 法 与 标 
准 库 的 Mutex 差 别 不 大 : 














USe 
USe 
USe 
USe 


std::sync::Arc; 
parking_lot: :Mutex; 
std::thread; 
std::sync::mpsc::channel; 


fn main() { 


const N: usize = 10; 
let data = Arc::new(Mutex: :new(0)); 


let (tx, rx) = channel(); 
for _ in 0..10 
let (data, tx) = (data.clone(), tx.clone()); 
thread::spawn(move || { 
let mut data = data.lock(); 
*data += 1; 
If *data == Nf{ 
tx.send(()).unwrap(); 





}); 
} 
println!i("{}", rx.recv().unwrap()); 
} 
这 个 库 也 给 我 们 展现 了 Rust 在 并 发 方面 的 高 度 可 扩展 性 ， 想 要 实现 


什么 功能 ， 基 本 不 会 因为 编译 占 的 限制 而 无 法 做 到 。 


31.4 crossbeam 


crossbeam 是 Rust 核 心 组 的 另外 一 位 重要 成 员 Aaron Turon 牵 头 开 发 
的 。 它 包含 了 并 行 开 发 的 很 多 方面 的 功能 ， 比 如 无 锁 数 据 类 型 ， 以 及 重 
新 设计 实现 的 管道 


我 们 知道 标准 库 给 了 一 份 mpsc (多 生产 者 单 消费 者 ) 管道 的 实现 ， 
但 是 它 有 许多 缺陷 。crossbeam- channel 这 个 库 给 我 们 提供 了 另外 一 和 套 管 
道 的 实现 方式 。 不 仅 包 括 mpsc， 还 包括 mpmc (多 生产 者 多 消费 者 ) ， 
而 且 使 用 便捷 ， 执 行 效率 也 很 高 。 


下 面 是 一 个 双 端 管道 的 使 用 示例 。 它 基本 实现 了 go 语言 的 内 置 管道 
功能 ， 在 执行 效率 上 甚至 有 过 之 而 无 不 及 。 大 家 可 以 到 GitHub 上 跟踪 一 
下 这 个 项 目的 进展 。 

















extern crate crossbeam; 
#[macro_usel] 
extern crate crossbeam channel as channel; 


use channel::{Receiver, Sender}; 


fn main() { 
let people = vec!["Anna", "Bob", "Cody", "Dave", "Eva"]; 
let (tx, rx) = channel::bounded(1); // Make room for one unmatched send. 
let (tx, rx) = (&tx, &rx); 
crossbeam: :scope(|s| { 
for name in people { 


s.spawn(move || seek(name, tx, rx)); 
}); 
If let Ok(name) = rx.try_recv() { 
println!("No one received {}’s message.", name); 


} 


// Either send my name into the channel or receive someone else's, whatever happens 
fn seek<'a>(name: &'a str, tx: &Sender<&'a str>, rx: &Receiver<&'a str>) { 
select_ loop! { 
recv(rx, peer) => printiln!("{} received a message from {}.", name, peer), 
send(tx, name) => {}, // Wait for someone to receive my message. 


31.5 rayon 


C# 语 言 有 一 个 很 厉害 的 PLinq 扩 展 ， 可 以 轻松 地 将 linq 语 句 并 行 化 。 
比如 : 





string[] words = new[] { "Welcome", "to", "Beijing","OK", "Hua", "Ying", "Ni" ,"2008"},; 
var lazyBeeQuery = from word in words.AsParallel() select word; 
lazyBeeQuery .ForAll<string>(word => { Console.writeLine(word); }); 





在 新 的 Ct++17 中 ， 标 准 库 也 支持 了 一 些 并 行 算法 : 





std::experimental: :parallel: :for_each( 
std: :experimental::parallel::par，// 并 行 执行 
Vv.begin(), v.end(), functor); 








在 Rust 中 ， 和 迭代 器 基本 已 经 与 ling 的 功能 差不多 。 那 我 们 能 不 能 做 
个 类 似 的 扩展 ， 让 普通 迭代 器 轻松 变 成 并 行 迭 代 器 呢 ?Rayon 的 设计 目 
标 就 是 这 个 。 

Rayon 是 Rust 核 心 组 成 员 Nicholas Matsakis 开 发 的 一 个 并 行 迭 代 器 项 
目 。 它 可 以 把 一 个 按 顺 序 执行 的 任务 轻松 变 成 并 行 执行 。 它 非常 轻 量 
0 








Rayon 的 API 主 要 有 两 种 : 


-并行 运 代 需 一 一 对 一 个 可 友 代 的 序列 调用 par_iter 方 法 ， 就 可 以 产 
生 一 个 并 行 迭 代 需 ; 


join 函数 一 一 它 可 以 把 一 个 递归 的 分 治 算法 问题 变 成 并 行 执 行 。 


照例 ， 我 们 用 示例 来 说 明 它 的 基本 用 法 。 比 如 ， 我 们 想 对 一 个 整数 
数组 执行 平方 和 计算 ， 可 以 这 样 做 : 








use rayon::prelude::*,; 
fn sum_of_squares(input: &[i32]) -> i32 { 
input.par_iter() // iter() 换 成 par_iter() 


.map(|&i| i * i) 
.Sum( ) 








这 个 问题 是 可 以 并 行 计算 的 ， 每 个 元 素 的 平方 操作 互 不 干扰 ， 如 果 
能 让 它们 在 不 同 线程 计算 ， 最 后 再 一 起 求 和 ， 可 以 提高 执行 效率 。 用 
Rayon 来 解决 这 个 问题 很 简单 ， 只 需 将 单线 程 情 况 下 的 iter() 方法 改 为 
par_iter〈) 即 可 。Rayon 会 在 后 台 启 动 一 个 线程 池 ， 自 动 分 配 任 务 ， 将 
多 个 元 素 的 map 操 作 分 配 到 不 同 的 线程 中 并 行 执行 ， 最 后 把 所 有 的 执行 
结果 汇总 再 相 加 。 


类 似 的 ， 这 个 迭代 器 也 有 mnut 版 本 。 假 如 我 们 想 并 行 修改 东 个 数 











Use rayon::prelude::*,; 
fn increment_all(input: &mut [i32]) { 
input.par_iter_mut() 
.for_each(|p| *p += 1); 
} 





Rayon 的 另外 一 种 使 用 方式 是 调用 join 函数 。 这 个 函数 特别 适合 于 分 
治 算法 。 一 个 典型 的 例子 是 写 一 个 快速 排序 算法 : 





fn partition<T:PartialOrd+Send>(v: &mut [T]) -> usize { 
let pivot = v.len() - 1; 
let mut i = 0，; 
for j in 0..pivot { 
if v[j] <= v[pivot] { 
Vv.swap(i, j); 
i += 1; 


} 


VvV.swap(i, pivot); 
本 


} 


fn quick_sort<T:PartialOrd+Send>(v: &mut [T]) { 
If v.len() <= 1{ 
return; 


} 


let mid = partition(v); 
let (lo, hi) = v.split at mut(mid); 
rayon::join(|| quick_sort(1l0), || quick_sort(hi)); 


} 


fn main() { 
let mut v = vec![10,9,8,7,6,5,4,3,2,1]; 


quick_sort(&mut v); 
println!("{:?}", Vv); 


在 快速 排序 算法 中 ， 我 们 可 以 先 把 数组 切 分 为 两 部 分 ， 然 后 分 别 再 
对 这 两 部 分 执行 快速 排序 。 在 这 里 ， 我 们 使 用 了 rayon: : join 函 数 。 


需要 注意 的 是 ， 并 行 迭 代 器 和 join 函数 并 不 是 简单 地 新 建 线程 ， 然 
后 在 两 个 线程 上 分 别 执行 。 它 内 部 实际 上 使 用 了 “work steal” 策 略 。 它 后 
台 的 线程 是 由 一 个 线程 池 管 理 的 ，join 函 数 只 是 把 这 两 个 闭 包 作为 两 个 
任务 分 发 出 去 了 ， 并 不 保证 这 两 个 闭 包 一 定 会 并 行 执行 或 者 串 行 执行 。 
如 条 现 在 有 空闲 线程 ， 那 么 空闲 线程 就 会 执行 这 个 任务 。 总 之 ， 哪 个 线 
程 有 空 ， 就 在 哪个 线程 上 执行 ， 它 不 会 让 某 些 线程 早早 结束 而 让 茶 些 任 
务 在 其 他 线程 里 面 等 每 。 所 以 ， 它 的 开销 是 非常 小 的 。Rayon 这 个 库 在 
性 能 测试 的 benchmark 上 的 表现 也 是 非常 不 错 的 ， 具 体 数据 大 家 可 以 伍 
看 官方 网 站 ， 或 者 自行 测试 。 


同时 ， 我 还 要 强调 一 点 ，Rayon 同 样 保 证 了 “线程 安全 ”。 比 如 ， 我 
们 如 果 想 在 两 个 任务 中 同时 修改 一 个 数组 ， 编 译 器 会 阻止 我 们 : 














fn increment_all(slice: &mut [i32]) { 
rayon::join(|| process(slice), || process(slice)); 
} 





我 们 应 该 能 猜想 到 ， 这 里 的 API 肯 定 用 到 了 Send、Sync 之 类 的 约 
束 ， 就 跟 标 准 库 中 的 spawn 函 数 一 样 。 因 此 第 三 方 库 也 一 样 能 享受 到 “ 线 
程 安全 ”的 优点。 


有 关 这 个 库 的 使 用 方法 以 及 其 内 部 实现 原理 ， 在 Nicholas Matsakis 
的 博客 有 详细 摘 述 ， 本 书 篇 由 有限 就 不 再 展开 了 。 从 这 个 库 我 们 可 以 看 
到 ，Rnust 为 各 种 并 行 开 发 的 模式 提供 了 无 限 的 可 能 性 。 虽 然 标准 库 在 这 
方面 提供 的 直接 选择 不 多 ， 但 并 没有 阻碍 我 们 实现 各 种 各 样 的 第 三 方 
和 
和 特点 。 











第 五 部 分 “实用 设施 
第 32 革 ”项 目 和 模块 


本 书 中 的 绝 大 部 分 代码 示例 都 是 很 短 的 ， 一 个 文件 就 可 以 搞定 。 但 
和 是， 任何 一 个 规模 稍微 大 一 点 的 项 目 都 不 能 这 么 写 。 我 们 需要 一 个 机 
制 ， 把 一 个 项 目 切 分 成 奋 干 小 部 分 ， 每 个 部 分 又 可 以 切 分 成 更 小 的 部 
分 ， 层 层 抽象 ， 通 过 这 种 方式 来 管理 复杂 的 代码 。 这 就 是 很 多 编程 语言 
中 都 有 的 “模块 系统 ”。 


Rust 用 了 两 个 概念 来 管理 项 目 : 一 个 是 crate， 一 个 是 mod。 


:crate 简 单 理解 就 是 一 个 项 目 。crate 是 Rust 中 的 独立 编译 单元 。 每 个 
crate 对 应 生成 一 个 库 或 者 可 执行 文件 〈 如 .lib.dll.so.exe 等 ) 。 官 方 有 一 
个 crate 仓 库 https://crates.io/ ， 可 以 供用 户 发 布 各 种 各 样 的 库 ， 用 户 也 可 
以 直接 使 用 这 里 面 的 开源 库 。 


-mod 简单 理解 就 是 命名 空间 。mod 可 以 艇 套 ， 还 可 以 控制 内 部 元 素 
的 可 见 性 。 


crate 和 mod 有 一 个 重要 区 别 是 : crate 之 间 不 能 出 现 循环 引用 ; 而 
mod 是 无 所 谓 的 ，mod1 要 使 用 mod2 的 内 容 ， 同 时 mod2 要 使 用 mod1 的 内 
容 ， 是 完全 没 问题 的 。 在 Rust 里 面 ，crate 才 是 一 个 完整 的 编译 单元 

(compile unit) 。 也 就 是 说 ，rustc 编 译 器 必须 把 整个 crate 的 内 容 全 部 读 
进去 才能 执行 编译 ，rustc 不 是 基于 单个 的 .rs 文件 或 者 mod 来 执行 编译 
的 。 作 为 对 比 ，C/C++ 里 面 的 编译 单元 是 单独 的 .co/.cpp 文 件 以 及 它们 所 
有 的 include 文 件 。 每 个 .o.cpp 文 件 都 是 单独 编译 ， 生 成 .o 文 件 ， 再 把 这 
些 .o 文 件 链接 起 来 。 


本 章 我 们 详细 讲解 一 下 crate 和 mod。 











32.1 cargo 








Cargo 是 Rust 的 包 管理 工具 ， 是 随 着 编译 器 一 起 发 布 的 。 在 使 用 
rustup 安 装 了 官方 发 布 的 Rust 开 发 套装 之 后 ，Cargo 工 具 就 已 经 安装 好 
了 了， 无须 单独 安装 。 我 们 可 以 使 用 cargo 命 令 来 得 看 它 的 基本 用 法 。 
Cargo 的 官方 使 用 文档 在 这 个 地 址 : https://doc.rust-lang.org/carg0/ 。 


Cargo 可 以 用 于 创建 和 管理 项 目 、 编 译 、 执 行 、 测 试 、 管 理 外 部 下 
载 的 包 和 可 执行 文件 等 。 


目 ， 一 步 步 带 领 大 家 学 习 cargo 的 
用 法 。 





< 


我 们 创建 一 个 新 的 工程 ， 这 个 工程 会 生成 一 个 可 执行 程序 。 步 又 如 


(1) 进入 项 目 文 件 夹 后 ， 使 用 如 下 命令 : 





cargo new hello world --bin 





后 面 的 一 bin 选 项 意味 着 我 们 希望 生成 的 是 可 执行 程序 ，cargo 会 帮 
助 我 们 生成 一 个 main.rs 的 模板 文件 。 


如 果 我 们 的 工程 是 一 个 library， 则 可 以 使 用 --lib 选 项 ， 此 时 上 自动 生 
成 的 是 一 个 lib.rs 的 模板 文件 。 


(2) 使 用 tree. 命 令 查 看 当前 的 文件 夹 结构 。 可 以 看 到 : 





[一 hello_ world 
| 一 Cargo.toml 
-一 src 


[一 main.rs 


2 directories, 2 files 





其 中 ，Cargo.tom] 是 我 们 的 项 目 管理 配置 文件 ， 这 里 记录 了 该 项 目 





相关 的 元 信息 。 关 于 这 个 文件 的 详细 格式 定义 ， 可 以 参考 官方 网 站 上 的 
帮助 文档 : https://doc.rust-lang.org/cargo/ 。 


src 文 件 夹 内 是 源 代码 。 


(3) 进入 hello_world 文 件 夹 ， 使 用 cargo build 命 令 ， 编 译 项 目 。 生 
成 的 可 执行 文件 在 ./target/debug/ 文 件 夹 内 。 如 果 我 们 使 用 cargo build-- 
release 命 令 ， 则 可 以 生成 release 版 的 可 执行 文件 ， 它 比 debug 版 本 优化 得 
更 好 。 


(4) 使 用 ./target/debug/hello_world 命 令 ， 或 者 cargo run 命 令 ， 可 以 
执行 我 们 刚 生 成 的 这 个 可 执行 程序 。 


在 Rust 中 ， 一 个 项 目 对 应 着 一 个 目标 文件 ， 可 能 是 library， 也 可 能 
征 可 执行 程序 。 现 在 我 们 试 斌 给 我 们 的 程序 添加 依赖 项 目 。 


进入 hello_world 的 上 一 层 文件 来， 新 建 一 个 library 项 目 : 





cargo new good_bye 








lib.rs 文 件 是 库 项 目的 入 口 ， 打 开 这 个 文件 ， 写 入 以 下 代码 : 





pub fn say() { 
println!("good bye"); 





使 用 cargo build， 编 译 通 过 。 现 在 我 们 希望 hello_world 项 目 能 引用 
good_bye 项 目 。 打 开 hello_world 项 目的 Cargo.toml 文 件 ， 在 依赖 项 下 面 
添加 对 good_bye 的 引用 。 





[dependencies] 
good bye = { path = "../good bye" } 





是 ee 如 果 要 引用 官方 仓库 中 的 库 更 简 
单 ， 比 如: 





[dependencies] 


lJazy_static = "1.0.0" 





现在 在 应 用 程序 中 调用 这 个 库 。 打 开 main.rs 源 文件 ， 修 改 代码 为 : 





extern crate good_bye; 


fn main() { 
println!("Hello, world!"); 
good_bye: :say(); 








再 次 使 用 cargo run 编 译 执行 ， 就 可 以 看 到 我 们 正确 调用 了 good_bye 
项 目 中 的 代码 。 


cargo 只 是 一 个 包 管 理工 具 ， 并 不 是 编译 器 。Rust 的 编译 器 是 rustc， 
使 用 cargo 编 译 工程 实际 上 最 后 还 是 调用 的 rustc 来 完成 的 。 如 果 我 们 想 知 
道 cargo 在 后 面 是 如 何 调用 rustc 完 成 编译 的 ， 可 以 使 用 cargo build-- 
Verbose 选 项 查看 详细 的 编译 命令 。 





cargo 在 Rust 的 生态 系统 中 扮演 着 非常 重要 的 角色 。 除 了 最 常用 的 
cargo new、cargo build、cargo run 等 命令 之 外 ， 还 有 很 多 有 用 的 命令 。 


我 们 可 以 用 cargo-h 来 查看 其 他 用 法 。 现 在 挑选 一 部 分 给 大 家 介绍 : 
check 





check 命 令 可 以 只 检查 编译 错误 ， 而 不 做 代码 优化 以 及 生成 可 执行 
程序 ， 非 常 适合 在 开发 过 程 中 快速 检查 语法 、 类 型 错误 。 





‘Clean 

清理 以 前 的 编译 结 
‘doc 

生成 该 项 目的 文档 。 
“test 


执行 单元 测试 。 


‘bench 
执行 benchmark 性 能 测试 。 
update 


升级 所 有 依赖 项 的 版 本 ， 重 新 生成 Cargo.lock 文 件 。 





-install 

安 闭 可 执行 程序 。 
-uninstall 

删除 可 执行 程序 。 


其 中 ，cargo install 是 一 个 非常 有 用 的 命令 ， 它 可 以 让 用 户 自己 扩展 
cargo 的 子 命令 ， 为 它 增加 新 功能 。 比 如 我 们 可 以 使 用 





cargo install cargo-tree 
安装 一 个 新 的 cargo 子 命令 ， 接 下 来 束 可 以 使 用 


cargo tree 





把 所 有 依赖 项 的 树 型 结构 打印 出 来 。 


在 crates.io 网 站 上 ， 用 subcommand 关 键 字 可 以 搜 出 许多 有 用 的 子 命 
令 ， 用 户 可 以 按 需 安装 。 


32.2 项目 依赖 


在 Cargo.toml 文 件 中 ， 我 们 可 以 指定 一 个 crate 依 赖 哪些 项 目 。 这 些 
依赖 既 可 以 是 来 自 官方 的 crates.io， 也 可 以 是 某 个 git 仓 库 地 址 ， 还 可 以 
是 本 地 文件 路 径 。 示 例如 下 : 








[dependencies] 

Jazy_static = "1.0.0" 

rand = { git = https://github.com/rust-lang-nursery/rand, branch = "master" } 
my_own_project = { path = "/my/local/path", version = "0.1.0" } 





Rust 里 面 的 crate 都 是 自 带 版 本 号 的 。 版 本 号 采用 的 是 语义 版 本 的 思 
想 ( 参 考 http://semver.org/ ) 。 基 本 意思 如 下 : 


1.0.0 以 前 的 版 本 是 不 稳定 版 本 ， 如 果 出 现 了 不 兼容 的 改动 ， 升 级 
次 版 本 号 ， 比 如 从 0.2.15 升 级 到 0.3.0; 


:在 1.0.0 版 本 之 后 ， 如 果 出 现 了 不 兼容 的 改动 ， 需 要 升级 主 版 本 
号 ， 比如 从 1.2.3 升 级 到 2.0.0; 


在 1.0.0 版 本 之 后 ， 如 果 是 兼容 性 的 增加 API， 虽 然 不 会 导致 下 游 用 
户 编译 失败 ， 但 是 增加 公开 的 API 情 况 ， 应 该 升级 次 版 本 号 。 


下 面 详细 讲 一 下 在 [dependencies] 里 面 的 几 种 依赖 项 的 格式 : 
(1) 来 自 crates.io 的 依赖 
绝 大 部 分 优质 开源 库 ， 作 者 都 会 发 布 到 官方 仓库 中 ， 所 以 我 们 大 部 
分 的 依赖 都 是 来 自 于 这 个 地 方 。 在 crates.io 中 ， 每 个 库 都 有 一 个 独 一 无 


我 们 要 依赖 茶 个 库 的 时 候 ， 只 需 指定 它 的 名 字 及 版 本 号 即 
可 ， 上 0: 














[dependencies] 
lazy_static = "1.0" 








指定 版 本 号 的 时 候 ， 可 以 使 用 模糊 匹配 的 方式 。 


:人 符号 ， 如 和 1.2.3 代 表 1.2.3<=version<2.0.0; 

~ 符号 ， 如 ~1.2.3 代 表 1.2.3<=version<1.3.0; 

符号 ， 如 1.* 代 表 1.0.0<=version<2.0.0; 

:比较 符号 ， 比 如 >=1.2.3、>1.2.3、<2.0.0、=1.2.3 含 义 基 本 上 一 日 了 
然 ， 还 可 以 把 多 个 限制 条 件 合 起 来 用 逗号 分 开 ， 比 如 version=">1.2， 
<1.9"。 

直接 写 一 个 数字 的 话 ， 等 同 于 ^ 符 号 的 意思 。 所 以 
lazy_static="1.0" 等 同 于 lazy_static="^1.0"， 含 义 是 1.0.0<=version<2.0.0。 
cargo 会 到 网 上 找到 当前 符合 这 个 约束 条 件 的 最 新 的 版 本 下 载 下 来 。 

(2) 来 自 git 仓 库 的 依赖 


本 我 们 还 可 以 指定 对 应 的 
a 














rand = { git = https://github.com/rust-lang-nursery/rand, branch = "next" } 





或 者 指定 当前 的 commit 号 : 





rand = { git = https://github.com/rust-lang-nursery/rand, branch = "master", rev = " 





还 可 以 指定 对 应 的 tag 名 字 : 





rand = { git = https://github.com/rust-lang-nursery/rand, tag = "0.3.15" } 





(3) 来 目 本 地 文件 路 径 的 依赖 
指定 本 地 文件 路 径 ， 既 可 以 使 用 绝对 路 径 也 可 以 使 用 相对 路 径 。 
当 我 们 使 用 cargo build 编 译 完 项 目 后 ， 项 目 文件 夹 内 会 产生 一 个 新 


文件 ， 名 字 叫 Cargo.lock。 它 实际 上 是 一 个 纯 文 本 文件 ， 同 样 也 是 toml 
格式 。 它 里 面 记 录 了 当前 项 目 所 有 依赖 项 目的 具体 版 本 。 每 次 编译 项 目 














的 时 候 ， 如 果 该 文件 存在 ，cargo 束 会 使 用 这 个 文件 中 记录 的 版 本 号 编 
译 项 目 ; 如 果 该 文件 不 存在 ，cargo 束 会 使 用 Cargo.toml 文 件 中 记录 的 依 
赖 项 目 信息 ， 目 动 选择 最 合适 的 版 本 。 


一 般 来 说 : 如 果 我 们 的 项 目 是 库 ， 那 么 最 好 不 要 把 Cargo.lock 文 件 
纳入 到 版 本 管理 系统 中 ， 避 免 依 赖 库 的 版 本 号 被 锁 死 ， 如 果 我 们 的 项 目 
是 可 执行 程序 ， 那 么 最 好 要 把 Cargo.lock 文 件 纳入 到 版 本 管理 系统 中 ， 
这 样 可 以 保证 ， 在 不 同 机 器 上 编译 使 用 的 是 同样 的 版 本 ， 生 成 的 是 同样 
的 可 执行 程序 。 


对 于 依赖 项 ， 我 们 不 仅 要 在 Cargo.toml 文 件 中 写 出 来 ， 还 要 在 源 代 
人 码 中 写 出 来 。 目 前 版 本 中 ， 必 须 在 crate 的 入 口 处 (对 库 项 目 就 是 lib.rs 文 
件 ， 对 可 执行 程序 项 目 束 是 main.rs 文 件 ) 写 上 : 














extern crate hello; // 声明 外 部 依赖 
extern crate hello as hi; // 可 以 重 命 名 








32.2.1 配置 


cargo 也 文 持 配置 文件 。 配 置 文件 可 以 定制 cargo 的 许多 行为 ， 就 像 
我 们 给 git 设 置 配置 文件 一 样 。 类 似 的 ，cargo 的 配置 文件 可 以 存在 多 
份 ， 它 们 之 间 有 优先 级 关系 。 你 可 以 为 某 个 文件 夹 单独 提供 一 份 配置 文 
件 ， 放 置 到 当前 文件 夹 的 .cargo/config 位 置 ， 也 可 以 提供 一 个 全 局 的 默 
认 配 置 ， 放 在 $HOME/.cargo/config 位 置 。 下 面 是 一 份 配置 示例 : 





[cargo-new] 
// 可 以 配置 默认 的 名 字 和 email, 这 些 会 出 现在 新 项 目的 Cargo.toml 中 
name = "..." 





































































































email = ",..." 

[build] 

jobs = 1 // 并 行 执行 的 rustc 程 序数 量 
rustflags = ["..",",."] // 编译 时 传递 给 rustc 的 额外 命令 行 参数 
[term] 

verbose = false // 执行 命令 时 是 否 打 印 详细 信息 
color = 'auto' // 控制 台 内 的 彩色 显示 
[alias] // 设置 命令 别名 

b = "build" 

t= "test" 

r = "run" 

rr = "run --release" 


二 一 





更 详细 的 信息 请 参考 官方 文档 。 
32.2.2 workspace 


cargo 的 workspace 概 念 ， 是 为 了 解决 多 crate 的 互相 协调 问题 而 存在 
的 。 假 设 现在 我 们 有 一 个 比较 大 的 项 目 。 我 们 把 它 拆 分 成 了 多 个 crate 来 
组 织 ， 就 会 面临 一 个 问题 : 不 同 的 crate 会 有 各 目 不 同 的 Cargo.toml， 编 
译 的 时 候 它 们 会 各 自 产生 不 同 的 Cargo.lock 文 件 ， 我 们 无 法 保证 所 有 的 
crate 对 同样 的 依赖 项 使 用 的 是 同样 的 版 本 号 。 


为 了 让 不 同 的 crate 之 间 能 共享 一 些 信息 ，cargo 提 供 了 一 个 
workspace 的 概念 。 一 个 workspace 可 以 包含 多 个 项 目 ， 所 有 的 项 目 共 享 
一 个 Cargo.lock 文 件 ， 共 享 同 一 个 输出 目录 ; 一 个 workspace 内 的 所 有 项 
的 公共 依赖 项 都 是 同样 的 版 本 ， 输 出 的 目标 文件 都 在 同一 个 文件 夹 


workspace 同 样 是 用 Cargo.toml 来 管理 的 。 我 们 可 以 把 所 有 的 项 目 都 
放 到 一 个 文件 夹 下 面 。 在 这 个 文件 夹 下 写 一 个 Cargo.toml 来 管理 这 里 的 
所 有 项 目 。Cargo.toml 文 件 中 要 写 一 个 [workspace] 的 配置 ， 比 如 : 








[workspace] 


members = [ 
"project1", "lib14" 








整个 文件 夹 的 目录 结构 如 下 : 





| 一 Cargo.1lock 

| 一 Cargo.toml 
project1 
| 一 Cargo.toml 


[一 main.rs 


| 
| 
1ib1 
硬 | 一 Cargo.toml 
| src 
区 








我 们 可 以 在 workspace 的 根 目 录 执 行 cargo build 等 命令 。 请 注意 ， 虽 


然 每 个 crate 都 有 自己 的 Cargo.toml 文 件 ， 可 以 各 自 配 置 自己 的 依赖 项 ， 
但 是 每 个 crate 下 面 不 再 会 各 自生 成 一 个 Cargo.lock 文 件 ， 而 是 统一 在 
workspace 下 生成 一 个 Cargo.lock 文 件 。 如 果 多 个 crate 都 依赖 一 个 外 部 
库 ， 那 么 它们 必然 都 是 依赖 的 同一 个 版 本 。 


32.2.3 build.rs 


cargo 工 具 还 允许 用 户 在 正式 编译 开始 前 执行 一 些 自 定 义 的 逻辑 。 
方法 是 在 Cargo.toml 中 配置 一 个 build 的 属性 ， 比 如 : 





[package] 


build = "build.rs" 





目 定 义 逻 辑 就 写 在 build.rs 文 件 里 面 。 在 执行 cargo build 的 时 候 ， 
cargo 会 先 把 这 个 build.rs 编 译 成 一 个 可 执行 程序 ， 然 后 运行 这 个 程序 ， 
做 完 后 再 开始 编译 真正 的 crate。build.rs 一 般 用 于 下 面 这 些 情况 : 

.提前 调用 外 部 编译 工具 ， 比 如 调用 gcc 编 译 一 个 C 库 ; 

:在 操作 系统 中 查找 C 库 的 位 置 ; 

-根据 某 些 配置 ， 自 动 生 成 源码 ; 

:执行 某 些 平台 相关 的 配置 。 


build.rs 里 面 甚至 可 以 再 依赖 其 他 的 库 。 可 以 在 build-dependencies 里 
面 指定 : 











[build-dependencies] 
rand = "1.0" 





build.rs 里 面 如 果 需 要 读 取 当前 crate 的 一 些 信息 ， 可 以 通过 环境 变量 
来 操作 。cargo 在 执行 这 个 程序 之 前 就 预先 设置 好 了 一 些 环境 变量 ， 比 
较 常 用 的 有 下 面 几 种 。 


‘CARGO_ MANIFEST_DIR 


当前 crate 的 Cargo.toml 文 件 的 路 径 。 
‘CARGO PKG NAME 

当前 crate 的 名 字 。 

‘OUT_DIR 


build.rs 的 输出 路 径 。 如 果 要 在 build.rs 中 生成 代码 ， 那 么 生成 的 代码 
就 要 存在 这 个 文件 夹 下 。 


:HOST 
当前 rustc 编 译 器 的 平台 特性 。 





:OPT LEVEL 

优化 级 别 。 

"了 PROFILE 

判断 是 release 还 是 debug 版 本 。 

更 多 的 环境 变量 请 参考 cargo 的 标准 文档 。 

下 面 还 是 用 一 个 完整 的 示例 演示 一 下 build.rs 功 能 如 何 使 用 。 假 设 我 
们 现在 要 把 当前 项 目 最 新 的 commit id 记 录 到 可 执行 程序 里 面 。 这 种 需求 
就 必须 使 用 自动 代码 生成 来 完成 。 首 先 新 建 一 个 项 目 


with commit_hash: 

















cargo new -bin with_commit_hash 





然后 ， 到 Cargo.toml 里 面 加 上 : 





build = "build.rs" 





当然 ， 对 应 的 ， 要 在 项 目 文件 夹 下 创建 一 个 build.rs 的 文件 。 


我 们 希望 能 在 编译 过 程 中 生成 一 份 源 代码 文件 ， 里 面 记录 了 一 个 和 
量 ， 类 似 这 样 : 





const CURRENT_ COMMIT_ID : &’static str = "123456789ABCDEF"; 





查找 当前 git 的 最 新 commit id 可 以 通过 命令 git rev-parse HEAD 来 完 
成 。 所 以 ， 我 们 的 build.rs 可 以 这 样 实现 : 





use std::env,; 

Use std::fs::File; 

use std::io::Write; 

use std::path::Path; 

use std::process::Command; 


fn main() { 
let out_dir = env::var("OUT_DIR").unwrap(); 
let dest_ path = Path::new(&out_dir).join("commit_id.rs"); 
let mut f = File::create(&dest path).unwrap(); 


let commit = Command: :new("git") 
.arg("rev-parse") 
.arg("HEAD") 
.Output() 
.expect("Failed to execute git command"); 
let commit = String::from utf8(commit,.stdout).expect("Invalid utf8 string"); 


let output = format!(r#"pub const CURRENT_COMMIT_ID : &'static Str = "{}";" #, ( 


f.write all(output.as_bytes()).unwrap(); 





输出 路 径 是 通过 读 取 OUT_DIR 环 境 变 量 获得 的 。 利 用 标准 库 里 面 
的 Command 类 型 ， 我 们 可 以 调用 外 部 的 进程 ， 并 获得 它 的 标准 输出 结 
果 。 最 后 再 构造 出 我 们 想 要 的 源码 字符 串 ， 写 入 到 目标 文件 中 。 


生成 了 这 份 代 码 之 后 ， 我 们 怎么 使 用 呢 ? 在 main.rs 里 面 ， 可 以 通过 
宏 直 接 把 这 部 分 源码 包含 到 项 目 中 来 : 





include!(concat!(env!("OUT_DIR"), "/commit_id.rs")); 


fn main() { 
println!("Current commit id is: {}", CURRENT_ COMMIT_ID); 





这 个 include! 宏 可 以 直接 把 目标 文件 中 的 内 容 在 编译 阶段 复制 到 当 


前 位 置 。 这 样 main 函 数 就 可 以 访问 CURRENT_COMMIT ID 这 个 常量 

了 。 大 家 要 记得 在 当前 项 目 使 用 git 命 令 新 建 儿 个 commit。 然后 编译 ， 执 
行 ， 可 见 在 可 执行 程序 中 包含 最 新 commit id 这 个 任务 就 完全 自动 化 起 来 
se 








32.3 ”模块 管理 


前 面 我 们 讲解 了 如 何 使 用 cargo 工 具 管 理 crate。 接 下 来 还 要 讲解 一 个 
crate 内 部 如 何 管理 模块 。 可 惜 的 是 ，Rnust 设 计 组 党 得 目前 的 模块 系统 还 
有 一 些 瑕 疫 ， 准 备 继续 改进 ， 在 编写 本 书 的 时 候 这 部 分 内 容 正 处 在 热火 
朝天 的 讨论 过 程 中 。 改 进 的 目标 是 思维 模型 更 简洁 、 更 加 具备 一 致 性 、 
方便 各 个 层次 的 用 户 。 所 以 本 书 在 这 部 分 不 会 强调 太 多 的 细节 ， 因 为 有 目 
前 一 些 看 起 来 比较 繁复 的 细节 将 来 很 可 能 会 得 到 简化 。 


32.3.1 文件 组 织 


mod 模块) 是 用 于 在 crate 内 部 继续 进行 分 层 和 封装 的 机 制 。 模 块 
内 部 又 可 以 包含 模块 。Rust 中 的 模块 是 一 个 典型 的 树 形 结构 。 每 个 crate 
会 自动 产生 一 个 跟 当 前 crate 同 名 的 模块 ， 作 为 这 个 树 形 结构 的 根 节点 。 
比如 在 前 面 使 用 cargo 创 建 多 个 项 目的 示例 中 ， 项 目 hello_world 依 赖 于 项 
日 good_bye， 我 们 要 调用 good_bye 中 的 函数 ， 需 要 写 good_bye: : 
say() ; ， 这 是 因为 say 方 法 存在 于 good_bye 这 个 mod 中 。 它 们 组 成 的 


树 形 关系 如 下 图 所 示 : 
mod hello world 









i fn main l mod good bye 


中 fn say 用 





企 一 个 crate 内 部 创建 新 模块 的 方式 有 下 面 几 种 。 


一 个 文件 中 创建 内 英模 块 。 直 接 使 用 mod 关 键 字 即 可 ， 模 块 内 容 包 
含 到 大 括号 内 部 。 


mod name { fn items() {} ..} 





-独立 的 一 个 文件 就 是 一 个 模块 。 文 件 名 即 是 模块 名 。 


一 个 文件 夹 也 可 以 创建 一 个 模块 。 文 件 夹 内 部 要 有 一 个 mod.rs 文 
件 ， 这 个 文件 束 是 这 个 模块 的 入 口 。 


使 用 哪 种 方式 编写 模块 取决 于 当时 的 场景 。 如 果 我 们 需要 创建 一 个 
小 型 子 模块 ， 比 如 单元 测试 模块 ， 那 么 直接 写 到 一 个 文件 内 部 就 非常 简 
单 而 且 直观 ， 如 果 一 个 模块 内 容 相 对 有 点 多 ， 那 么 把 它 单独 写 到 一 个 文 
件 内 是 更 容易 维护 的 ; 如 果 一 个 模块 的 内 容 太 多 了 ， 那 么 把 它 放 到 一 个 
文件 夹 中 就 更 合理 ， 因 为 我 们 可 以 把 真正 的 内 容 继 续 分 散 到 更 小 的 子 模 
块 中 ， 而 在 mod.rs 中 直接 重新 导出 (re-export) 。 这 样 mod.rs 的 源码 就 大 
幅 简 化 ， 不 影响 外 部 的 调用 者 。 

可 以 这 样 理解 : 模块 是 一 种 更 抽象 的 概念 ， 文 件 是 承载 这 个 概念 的 
实体 。 但 是 模块 和 文件 并 不 是 简单 的 一 一 对 应 关系 ， 用 户 可 以 自己 维护 
这 个 映射 关系 。 


比如 ， 我 们 有 一 个 crate 内 部 包含 了 两 个 模块 ， 一 个 是 caller 一 个 是 
worker。 我 们 可 以 有 几 种 方案 来 实现 。 


方案 一 : 直接 把 所 有 代码 都 写 到 lib.rs 里 面 : 




















// <lib.rs> 
mod caller { 
fn call() {} 


mod worker { 
fn work1() 1 
fn work2() 他 
fn work3() 他 


方案 二 : 把 这 两 个 模块 分 到 两 个 不 同 的 文件 中 ， 分 别 叫 作 caller.rs 和 
worker.rs。 那 么 我 们 的 项 目 束 有 了 三 个 文件 ， 它 们 的 内 容 分 别 是 : 





// <lib.rs> 
mod caller; 
mod worker; 

// <caller.rs> 
fn call() 全 


// <worker ,rs> 
fn work1() 1{} 
fn work2() 1{} 
fn work3() 1{} 








因为 lib.rs 是 这 个 crate 的 入 口 ， 我 们 需要 在 这 里 声明 它 的 所 有 子 模 
块 ， 否 则 callerrs 和 worker.rs 都 不 会 被 当成 这 个 项 目的 源码 编译 。 


方案 三 : 如 果 worker.rs 这 个 文件 包含 的 内 容 太 多 ， 我 们 还 可 以 继续 
J Ns 





// <lib.rs> 

mod caller; 

mod worker; 

// <caller.rs> 

fn call() 全 

// <worker/mod.rs> 

mod worker1; 

mod worker2; 

mod worker3; 

// <worker/workeri1.rs> 
fn work1() 1{} 

// <worker/worker2.rs> 
fn work2() 人 

// <worker/worker3.rs> 
fn work3() 1{} 





这 样 就 把 一 个 模块 继续 分 成 了 几 个 小 模块 。 而 且 worker 模 块 的 拆 分 
其 实 是 不 影响 caller 模 块 的 ， 只 要 我 们 在 worker 模 块 中 把 它 子 模块 内 部 的 
东西 重新 导出 (re-export) 就 可 以 了 。 这 个 是 可 见 性 控制 的 内 容 ， 下 面 
我 们 继续 介绍 可 见 性 控制 。 


32.3.2 可见 性 


我 们 可 以 给 模块 内 部 的 元 素 指 定 可 见 性 。 默 认 都 是 私有 ， 除 了 两 种 
例外 情况 : 一 是 用 pub 修 饰 的 trait 内 部 的 关联 元 素 (associated item ) ， 
默认 是 公开 的 ; 二 是 pub enum 内 部 的 成 员 默 认 是 公开 的 。 公 开 和 私有 的 
访问 权限 是 这 样 规定 的 : 


:如 果 一 个 元 素 是 私有 的 ， 那 么 只 有 本 模块 内 的 元 素 以 及 它 的 子 模 
块 可 以 访问 ; 


如果 一 个 元 素 是 公开 的 ， 那 么 上 一 层 的 模块 就 有 权 访 问 它 。 
示例 如 下 : 





mod top_mod1 { 
pub fn method1() 全 


pub mod inner_mod1 { 
pub fn method2() 人 


fn method3() 人 
} 


mod inner_ mod2 { 
fn method4() 1 


mod inner_mod3 { 
fn call fn_inside() { 
super: :method4(); 


} 
} 
} 


fn call_fn_outside() { 

::top_mod1: :method1() ， 

:top_mod1: :inner_mod1::method2()， 
} 





在 这 个 示例 中 ，top_mod1 外 部 的 函数 call_fn_outside () ， 有 权 访 
问 method1 () ， 因 为 它 是 用 pub 修 饰 的 。 同 样 也 可 以 访问 
method2 〈() ， 因 为 inner_mod1 是 pub 的 ， 而 且 method2 也 是 pub 的 。 而 
inner_ mod2 不 是 pub 的 ， 所 以 外 部 的 函数 是 没 法 访问 method4 的 。 但 是 
call_fn_inside 是 有 权 访 问 method4 的 ， 因 为 它 在 method4 所 处 模块 的 子 模 
块 中 。 


模块 内 的 元 素 可 以 使 用 pub use 重 新 导出 (re-export) 。 这 也 是 Rust 
模块 系统 的 一 个 重要 特点 。 示 例如 下 : 





mod top_mod1 { 
pub use self::inner_ mod1: :method1; 


mod inner_mod1 { 
pub use self::inner_mod2::method1; 


mod inner_ mod2 { 
pub fn method1() {} 
} 


} 


} 


fn call fn outside() { 
::top_mod1: :method1(); 
} 





在 call_fn_outside 函 数 中 ， 我 们 调用 了 top_modl 中 的 函数 method1 。 
可 是 我 们 注意 到 ，method1 其 实 不 是 在 top_mod1 内 部 实现 的 ， 它 只 是 把 
它 内 部 inner_ mod1 里 面 的 函数 重新 导出 了 而 已 。pub use 就 是 起 这 样 的 作 
用 ， 可 以 把 元 素 当 成 模块 的 直接 成 员 公 开 出 去 。 我 们 继续 往 下 看 还 可 以 
发 现 ， 这 个 函数 在 inner_ mod1 里 面 也 只 是 重新 导出 的 ， 它 的 真正 实现 是 
在 inner mod2 里 面 。 


这 个 机 制 可 以 让 我 们 轻松 做 到 接口 和 实现 的 分 离 。 我 们 可 以 先 设计 
好 一 个 模块 的 对 外 API， 这 个 固定 下 来 之 后 ， 它 的 具体 实现 是 可 以 随便 
改 ， 不 影响 外 部 用 户 的 。 我 们 可 以 把 具体 实现 写 到 任何 一 个 子 模 块 中 ， 
然后 在 当前 模块 重新 导出 即 可 。 对 外 部 用 户 来 说 ， 这 没什么 区 别 。 


不 过 这 个 机 制 有 个 上 采 烦 之 处 就 是 ， 如 果 有 具体 实现 典 套 在 很 深层 次 的 
子 模块 中 的 话 ， 要 把 它 导 出 到 最 外 面 来 ， 必 须 一 层 层 地 转 用 ， 任 何 一 层 
没有 重新 导出 ， 都 是 无 法 达到 目标 的 。 


Rust 里 面 用 pub 标 记 了 的 元 素 最 终 可 能 在 哪 一 层 可 见 ， 并 不 能 很 简 
单 地 得 出 结论 。 因 为 它 有 可 能 被 外 面 重新 导出 。 为 了 更 清晰 地 限制 可 见 
性 ，Rust 设 计 组 又 给 pub 关 键 字 增加 了 下 面 的 用 法 ， 可 以 明确 地 限定 元 
素 的 可 见 性 : 






































pub(crate) 

pub(in xxx_mod) 

pub(self) 或 者 pub(in self) 
pub(super) 或 者 pub(in super) 





示例 如 下 : 





mod top_mod { 
pub mod inner_mod1 { 
pub mod inner_mod2 
pub(self) fn method1() {} 
pub(super) fn method2() 人 
pub(crate) fn method3() 人 


// Error: 
// pub use self::inner_mod2::method1; 
fn caller1() { 


// Error: 
// self::inner_mod2::method1(); 
} 
} 
fn caller2() { 
// Error: 
// self::inner_modi::inner_mod2: :method2(); 
} 
} 
// Error: 


// pub use ::top_mod::inner_modi1::inner_mod2::method3; 





在 inner_ _mod2 模 块 中 定义 了 几 个 函数 。method1 用 了 pub (self) 限 
制 ， 那 么 它 最 多 只 能 被 这 个 模块 以 及 子 模块 使 用 ， 在 模块 外 部 调用 或 者 
重新 导出 都 会 出 错 。method2 用 了 pub (super) 限制 ， 那 么 它 的 可 见 性 最 
多 就 只 能 到 inner_ mod1 这 一 层 ， 在 这 层 外 面 不 能 被 调用 或 者 重新 导出 。 
而 method3 用 了 pub〈crate) 限制 ， 那 么 它 的 可 见 性 最 多 惑 只 能 到 当前 
crate 这 一 层 ， 再 继续 往外 重新 导出 ， 就 会 出 错 。 





32.3.3 use 关键 字 


前 面 我 们 用 了 很 多 完整 路 径 来 访问 元 隶 。 比 如 : 





:top_mod1: :inner_ mod1::method2() ， 





Rust 里 面 的 路 径 有 不 同 写法 ， 它 们 代表 的 含义 如 下 : 


.以 ，: 开头 的 路 径 ， 代 表 全 局 路 径 。 它 是 从 crate 的 根部 开始 算 





mod top_mod1 { 
pub fn f1() 1 
} 


mod top_mod2 { 
pub fn call() { 
::top_mod1::f1i(); // 当前 crate 下 的 top_mod1 
} 








.以 Super 关键 字 开头 的 路 径 是 相对 路 径 。 它 是 从 上 层 模 块 开 始 算 





mod top_mod1 { 
pub fn fl1() {} 


mod inner_mod1 { 
pub fn call() { 
super::f1(); // 当前 模块 ijnner_mod1 的 父 级 模块 中 的 f1 函 数 








:以 self 关 键 字 开 头 的 路 径 是 相对 路 径 。 它 是 从 当前 模块 开始 算 的 : 





mod top_mod1 { 
pub fn f1() {} 


pub fn call() { 
self::f1(); // 当前 模块 top_mod1 中 的 f1 函 数 
} 





} 





如 果 我 们 需要 经 党 重复 性 地 写 很 长 的 路 径 ， 那 么 可 以 使 用 use 语 句 
把 相应 的 元 素 引 入 到 当前 的 作用 域 中 来 。 


-use 语句 可 以 用 大 括号 ， 一 句 话 引入 多 个 元 素 : 








use std::io::{self，Read，Write}; // 这 句 话 引入 了 io / Read / Write 三 个 名 字 





use 语句 的 大 括号 可 以 艇 套 使 用 : 





use a::b::{c, d, e::{f, g::{h, i}} }; 





"use 语句 可 以 使 用 星 写 ， 引 入 所 有 的 元 素 : 








use std::io::prelude::*; // 这 句 话 引入 了 std::io::prelude 下 面 所 有 的 名 字 

















Use 语句 不 仅 可 以 用 在 模块 中 ， 还 可 以 用 在 函数 、trait、impl 等 地 





fn call() { 
use std::collections::Hashset,; 
let s = HashSet::<i32>: :new(); 
} 





"use 语句 允许 使 用 as 重 命名 ， 避 人 免 名 字 冲 突 : 





use std::result::Result as StdResult,; 
use std::io::Result as IoResult; 





第 33 章 ”错误 处 理 


错误 处 理 指 的 是 处 理 程 序 的 非 正 常 执行 流程 。 比 如 ， 我 们 要 打开 一 
个 文件 ， 就 不 能 只 考虑 文件 正常 打开 情况 ， 在 实际 中 有 可 能 因为 各 种 原 
> 
行 流程 。 


Rust 把 错误 分 成 了 两 大 类 。 一 类 是 不 可 恢复 错误 ， 建 议 使 用 panic 来 
处 理 。 对 于 不 可 恢复 错误 ， 本 质 上 没有 办 法 在 程序 执行 阶段 做 好 处 理 
的 ， 那 么 就 应 该 用 panic 让 程序 主动 退出 ， 由 开发 者 来 修复 源码 ， 这 是 唯 
一 合理 的 方案 。 男 外 一 类 错误 是 可 恢复 错误 ， 一 般 使 用 返回 值 来 处 理 。 
比如 打开 文件 出 错 这 种 问题 ， 应 该 是 设计 阶段 能 预计 到 的 ， 可 以 在 执行 
阶段 更 好 处 理 的 问题 ， 就 适合 采用 这 种 方案 。 本 章 主 要 关注 这 一 类 的 错 
误 处 理 。 




















33.1 基本 错误 处 理 


Rnust 的 错误 处 理 机 制 ， 主 要 还 是 基于 返回 值 的 方案 。 不 过 因为 拥有 
代数 类 型 系统 这 套 机 制 ， 所 以 它 比 C 语 言 那 种 原始 的 错误 码 方案 表达 能 
力 更 强 一 点 。Rust 用 于 错误 处 理 的 最 基本 的 类 型 就 是 我 们 常见 的 
Option<T> 类 型 。 比 如 ， 内 置 字 符 串 类 型 有 一 个 find 方 法 ， 碍 找 一 个 子 
串 : 











impl] str 
pub fn find<'a, P: Pattern<'a>>(&'a self, pat: P) -> Option<usize> {} 


这 个 方法 当然 是 可 能 失败 的 ， 它 有 可 能 找 不 到 。 为 了 表达 “成 功 返 
回 了 二 “以 0 ;这 两 种 情况 ，Option<usize> 就 是 一 个 非 
和 常 合理 的 选择 。 而 在 传统 的 C 语 言 里 面 ， 由 于 缺乏 代数 类 型 系统 ， 往 往 
会 选择 使 用 返回 类 型 中 的 某 些 特殊 值 来 表示 非 正 和 常 的 情况 。 比 如 ，C 标 
准 库 中 的 子 串 查找 函数 的 签名 是 这 样 的 : 








char *strstr( const char* str, const char* substr ) 0} 


返回 的 束 是 char* 指 针 ， 使 用 空 指针 代表 没 找到 的 情况 


对 于 这 种 简单 的 错误 处 理 ， 类 合 一 下 问题 也 不 大 。 如 果 错 误 信 
奶 更 复杂 一 些 ， 比如 婚 需 要 用 请 误 色 表 呆 嫩 误 的 原因 1 又 需要 返回 正 冰 
的 返回 值 ， 就 麻烦 一 些 了 。 一 般 C 语 言 的 做 法 是 ， 用 返回 值 代 表 错 误 
码 ， 把 真正 需要 返回 的 内 容 使 用 指针 通过 参数 传递 出 去 。 比 如 C99 里 面 
打开 文件 的 函数 是 这 样 设计 的 : 














FILE *fopen( const char *restrict filename, const char *restrict mode ); 


到 了 C11 又 新 增 了 一 个 支持 多 个 错误 码 的 打开 文件 的 函数 : 


errno_t fopen_s(FILE *restrict *restrict streamptr, 
const char *restrict filename, 


const char *restrict mode); 








这 种 方式 明显 是 牺牲 了 可 读 性 和 使 用 方便 性 的 。 


在 Rust 里 面 就 不 用 这 么 唉 烦 了 。 我 们 可 以 使 用 Result<T，E> 类 型 来 
处 理 这 种 情况 ， 干净 利落 : 





impl] File { 
pub fn open<P: AsRef<Path>>(path: P) -> io::Result<File> {} 
} 





上 面 这 个 例子 使 用 了 std: : io: : Result 类 型 ， 而 不 是 std: : 
result: : Result 类 型 。 但 是 实际 上 它们 是 一 回 事 ， 因 为 在 io 模 块 中 有 个 
类 型 别名 的 定义 : 





pub type Result<T> = result::Result<T, Error>; 





这 就 是 说 ， std: : io: : Result<T> 等 于 std: : result: 
Result<T，std: : io: : Error>。 只 是 把 泛 型 中 的 上 参数 定 成 了 std: 
io: : Error 这 个 具体 类 型 而 已 。 


代数 类 型 系统 是 错误 处 理 的 利器 。 我 们 再 看 一 个 例子 。 标 准 库 中 有 


一 个 FromStr trait: 








pub trait FromStr: Sized { 

type Err; 

fn from_str(s: &str) -> Result<Self, Self::Err>; 
} 





| 如 果 我 们 想 从 一 个 字符 串 构 造 出 一 个 类 型 的 实例 ， 就 可 以 对 这 个 类 
型 实现 这 个 trait。 当 然 这 个 转换 是 有 可 能 出 错 的 ， 所 以 from_str 方 法 一 定 
要 返回 一 个 Result 类 型 。 比 如 针对 bool 类 型 实现 的 这 个 trait; 





impl FromStr for bool { 
type Err = ParseBoolError ， 
#[inline] 
fn from_str(s: &str) -> Result<bool, ParseBoolError> { 
match s { 
"true" => Ok(true), 


"false" => Ok(false), 

区 => Err(ParseBoolError { _priv: () }), 
} 

} 


} 





正常 情况 是 bool 类 型 ， 异 常情 况 是 ParseBoolError 类 型 。 这 个 
ParseBoolError 不 需要 携带 其 他 额外 信息 ， 所 以 它 是 一 个 空 结 构 体 束 够 
忠志 


我 们 再 看 看 FromStr 针 对 f32 的 实现 。 可 以 看 到 ， 从 字符 串 解析 浮 操 
数 可 能 出 现 的 错误 种 类 更 多 ， 所 以 错误 类 型 被 设计 成 了 一 个 enum: 





enum FloatErrorKind { 
Empty, 
Invalid, 


} 





最 后 我 们 再 看 看 FromStr 针 对 String 的 实现 。 因 为 从 &str 到 String 的 这 
个 转换 一 定 是 可 以 成 功 的 ， 不 存在 失败 的 可 能 ， 所 以 这 种 情况 下 错误 类 
型 被 设计 成 了 空 的 enum: 





pub enum ParseError {} 





前 面 我 们 已 经 说 过 了 ， 空 的 enum 就 是 bottom type， 等 同 于 发 散 类 
型 ! 。 所 以 这 个 错误 实际 上 没有 任何 额外 性 能 开销 ， 证 明 如 下 : 





use std::str::Fromstr; 
use std::string::ParseError; 
Use std::mem::{size of, size of val}; 


fn main() { 
let r : Result<String, ParseError> = FromStr::from str("hello"); 
println!("Size of String: {}", Size of::<String>()); 
println!("Size of rr :全 "Size of _val(&r)); 





这 个 返回 类 型 Result<String，ParseError> 实 际 上 和 String 是 同 构 的 。 


所 以 说 ，Rust 的 这 套 错 误 处 理 机 制 既 具 备 展 好 的 抽象 性 ， 也 有 具备 无 
额外 性 能 损失 的 优点 。 


332 钥 合 钙 误 关 型 


利用 代数 类 型 系统 做 错误 处 理 的 男 外 一 大 好 处 是 可 组 合 性 
(composability) 。 比 如 Result 类 型 有 这 样 的 一 系列 成 员 方 法 : 





fn map<U, F>(self, op: F) -> Result<U, E> where F: Fnonce(T) -> U 

fn map_err<F, O>(self, op: 0) -> Result<T, F> where 0: Fnonce(E) -> F 

fn and<U>(self, res: Result<U, E>) -> Result<U, E> 

fn and_then<U, F>(self, op: F) -> Result<U, E> where F: Fnonce(T) -> Result<U, E> 
fn or<F>(self, res: Result<T, F>) -> Result<T, F> 

fn or_else<F, 0>(self, op: 0) -> Result<T, F> where 0: Fnonce(E) -> Result<T, F> 








这 些 方法 的 签名 稍微 有 点 复杂 ， 涉 及 许多 泛 型 参数 。 它 们 之 间 的 区 
别 也 就 表现 在 方法 签名 中 。 我 们 可 以 用 下 面 的 方式 去 掉 语 法 干扰 之 后 ， 
来 阅读 函数 签名 ， 从 而 理解 这 些 方法 之 间 的 区 别 : 


方 法 参数 类 型 
and then T -> Result<U, E> 
or_else B -> Result<T, F> 


通过 这 个 表格 的 对 比 ， 我 们 可 以 很 容易 看 出 它们 之 间 的 区 别 。 比 如 
map 和 和 and_then 的 主要 区 别 是 闭 包 参数 : map 的 参数 是 做 的 >U 的 转 
换 ， 而 and_then 的 参数 是 T->Result 的 转换 。Option 类 型 也 有 类 似 的 对 应 
读者 可 以 目 己 建 一 个 表格 ， 对 比 一 下 这 些 方法 签名 之 间 的 区 
别 。 











下 面 用 一 个 示例 演示 一 下 这 函数 的 用 法 : 





use std::env; 


fn double arg(mut argv: env::Args) -> Result<i32, String> { 
argv.nth(1) 
.Ok_or("Please give at least one argument".to_owned()) 
.and_then(|arg| arg.parse::<i32>().map_err( 
|err| err.to_string())) 
.map(|n| 2 * n) 


} 


fn main() { 
match double arg(env::args()) { 
Ok(n) => println!("{}", Nn), 
Err(err) => println!("Error: {}", err), 


33.3” 问 号 运算 符 


Result 类 型 的 组 合 调用 功能 很 强大 ， 但 是 它 有 一 个 缺点 ， 束 是 经 第 
会 发 生 舱 套 层 次 太 多 的 情况 ， 不 利于 可 读 性 。 比 如 下 面 这 个 示例 : 








use std::fs::File; 
use std::io::Read; 
use std::path::Path; 


fn file _ double<P: AsRef<Path>>(file path: P) -> Result<i32, String> { 
File: :open(file_path) 
.map_err(l|err| err.to_string()) 
.and_then(|mut file| { 
let mut contents = String::new(); 
file.read to_string(&mut contents) 
.map_err(l|err| err.to_string()) 
.map(|_| contents) 


.and_then(|contents| { 
contents.trim().parse: :<i32>() 
.map_err(l|err| err.to_string()) 


}) 
.map(|In| 2 * n) 
} 


fn main() { 
match file double("foobar") { 
Ok(n) => println!("{}", Nn), 
Err(err) => println!("Error: {}", err), 


} 





这 说 明 我 们 还 有 继续 改进 的 空间 。 为 了 方便 用 户 ，Rust 设 计 组 在 前 
面 这 套 系统 的 基础 上 上， 又 加 入 了 一 个 问号 运算 符 ， 用 来 简化 源 代 码 。 这 
个 问号 运算 符 完全 是 建立 在 前 面 这 套 错 误 处 理 机 制 上 的 语法 糖 。 


问号 运算 符 童 思 是 ， 如 果 结 果 是 Err， 则 提前 返回 ， 否 则 继续 执 




















/一 


介 。 


使 用 问号 运算 符 ， 我 们 可 以 把 科 e_double 函 数 简化 成 这 样 : 





fn file _ double<P: AsRef<Path>>(file path: P) -> Result<i32, String> { 
let mut file = File::open(file path).map_err(|el| e.to_ string())?; 
let mut contents = String::new(); 
file.read to_string(&mut contents) 
.map_err(l|err| err.to_string())?; 


let n = contents.trim().parse::<i32>() 
.map_err(|err| err.to_string())?; 


Ok(2 * n) 








这 里 依然 有 不 少 的 map_err 调 用 ， 主 要 原因 是 返回 类 型 限制 成 了 
Result<i32，String>。 如 有 果 改 一 下 返回 类 型 ， 代 码 还 能 继续 精简 。 


因为 这 段 代码 总 共有 两 种 错误 : 一 种 是 io 错误 ， 用 std: : io: 
Error 表 示 ; 另外 一 种 是 字符 串 转 整数 错误 ， 用 std: : num: : 
ParseIntError 表 示 。 我 们 要 把 这 两 种 类 型 统一 起 来 ， 所 以 使 用 了 一 个 自 
定义 的 enum 类 型 ， 这 样 map_err 方 法 调用 就 可 以 省 略 了 。 我 们 再 补充 这 
两 种 错误 类 型 到 目 定义 错误 类 型 之 间 的 类 型 转换 ， 问 题 就 解决 了 。 完 整 
源码 如 下 所 示 : 





use std::fs::File; 
use std::io::Read; 
use std::path::Path; 


#[derive(Debug)] 

enum MyError { 
Io(std::io::Error), 
Parse(std::num: :ParseIntError), 


} 


impl From<std::io::Error> for MyError { 
fn from(error: std::io::Error) -> Self { 
MyError::Io(error) 
} 


} 


impJ From<std: :num: :ParseIntError> for MyError { 
fn from(error: std::num::ParseIntError) -> Self { 
MyError::Parse(error) 
} 


} 


fn file double<P: AsRef<Path>>(file path: P) -> Result<i32, MyError> { 
let mut file = File::open(file_path)?， 
let mut contents = String: :new(); 
file.read to_string(&mut contents)?; 
let n = contents.trim().parse::<i32>()?; 
Ok(2 * n) 
} 


fn main() { 
match file double("foobar") { 
Ok(n) => println!i("{}", Nn), 
Err(err) => println!("Error: {:?}", err), 


这 样 一 来 ， 这 个 file_double 函 数 就 精简 太 多 了 。 它 只 需 管 理 正常 远 
辑 ， 对 于 可 能 出 错 的 分 支 ， 直 接 一 个 问号 操作 符 提 前 返回 ， 错 误 处 理 和 
正常 逻辑 互 不 干扰 ， 清 晰 易 读 。 


下 面 继续 讲解 一 下 问号 运算 符 背 后 做 了 什么 事情 。 跟 其 他 很 多 运算 
符 一 样 ， 问 号 运算 符 也 对 应 着 标准 库 中 的 一 个 trait std: : ops: : Try。 
适 刚 定义 好 下: 











trait Try { 
type Ok; 
type Error; 
fn into_result(self) -> Result<Self::Ok, Self::Error>; 
fn from error(v: Self::Error) -> Self,; 
fn from ok(v: Self::Ok) -> Self; 





en" 编译 占 会 把 expr? 这 个 表达 式 上 自动 转换 为 以 下 语义 〈 不 在 catch 块 内 
9 情况) : 





match Try: :into_result(expr) { 
Ok(v) => v, 


// here, the ‘return’ presumes that there is 
// no -catch ”in scope: 
Err(e) => return Try::from error(From::from(e)), 








哪些 类 型 文 持 这 个 问号 表达 式 呢 ? 标准 库 中 已 经 为 Option、Result 
两 个 类 型 impl 了 这 个 trait: 





impl<T> ops::Try for Option<T> { 
type Ok = T; 
type Error = NoneError; 


fn into_result(self) -> Result<T, NoneError> { 


self.ok_or(NoneError) 
} 


fn from ok(v: T) -> Self { 
Some(v) 


fn from error(_: NoneError) -> Self { 
None 
} 


} 

impl<T,E> ops::Try for Result<T, E> { 
type Ok = T; 
type Error = E; 


fn into_result(self) -> Self { 


self 

} 

fn from ok(v: T) -> Self { 
Ok(v) 


fn from error(v: E) -> Self { 
Err(v) 





把 这 些 综合 起 来 ， 我 们 就 能 理解 对 于 Result 类 型 ， 执 行 问 号 运算 符 
做 了 什么 了 。 其 实 束 是 倍 到 Er 的 话 ， 调 用 From trait 做 个 类 型 转换 ， 然 
后 中 断 当 前 逻辑 提前 返回 。 


和 Try trait 一 起 设计 的 ， 还 有 一 个 临时 性 的 do catch 语 法 。 在 使 用 do 
catch 的 情况 下 ， 问 号 运算 符 驶 不 是 直接 退出 函数 ， 而 是 退出 do catch 
块 。 示 例如 下 : 











fn file_ double<P: AsRef<Path>>(file path: P) { 

let r : Result<i32, MyError> = do catch { 
let mut file = File::open(file_ path)?; 
let mut contents = String::new(); 
file.read to_string(&mut contents)?; 
let n = contents.trim().parse::<i32>()?; 
Ok(2 * n) 

}; 

match r { 
Ok(n) => println!("{}", nN), 
Err(err) => printin!("Error: {:?}", err), 

} 


} 





目前 使 用 这 个 语法 需要 打开 #1! [feature (catch_expr)〉] 这 个 feature 
gate。 而 且 语 法 也 是 do catch{} 这 样 的 写法 。 这 么 做 是 为 了 避免 导致 代码 
不 兼容 的 问题 。 以 前 的 版 本 中 ，catch 这 个 单词 不 是 关键 字 ， 可 能 就 有 用 
户 使 用 了 catch 这 个 名 字 作 为 标识 符 名 字 。 如 果 我 们 直接 把 这 个 单词 升级 
为 天 键 字 ， 必 然 导 致 菜 些 现存 代码 编译 错误 。 所 以 引入 关键 字 这 种 事 
情 ， 一 定 要 通过 edition 的 厂 本 更 欠 来 完成 。 在 Rust 2018 edition 中 ， 所 有 
使 用 catch 作 为 标识 符 的 代码 都 会 生成 一 个 警告 ， 但 依然 编译 通过 。 再 下 








一 个 edition 的 时 候 ，catch 就 可 以 提升 为 正式 关键 字 了 ， 到 那 时 ， 就 不 需 
要 do catch{} 语 法 ， 而 是 直接 使 用 catch{} 了 。 “以 后 也 可 能 选择 try 作 为 
关键 字 ， 目 前 还 没有 定论 。) 


大 家 可 能 又 发 现 ， 如 有 果 使 用 问号 运算 待 ， 主 要 逻辑 那 部 分 确实 已 经 
简化 得 非常 干净 ， 但 是 其 他 部 分 的 代码 量 又 有 了 增长 。 我 们 需要 定义 新 
的 错误 类 型 ， 实 现 一 些 trait， 才 能 让 它 工作 起 来 。 这 部 分 能 不 能 更 简化 
一 点 呢 ? 答案 是 肯定 的 。 


其 中 一 个 方案 是 ， 使 用 trait object 来 蔡 换 enum。 实 际 上 trait object 和 
enum 有 很 大 的 相似 性 ， 它 们 都 可 以 把 一 系列 的 类 型 统一 成 一 个 类 型 。 
恰好 标准 库 内 部 给 我 们 提供 了 一 个 trait， 来 统一 抽象 所 有 的 错误 类 型 ， 


它 就 是 std: : error: : Error: 











pub trait Error: Debug + Display { 

fn description(&self) -> &str,; 

fn cause(&self) -> Option<&dyn Error> { ...} 
} 








所 有 标准 库 里 面 定 义 的 错误 类 型 都 已 经 实现 了 这 个 trait。 所 以 ,我 
们 可 以 想象 ， 错 误 类 型 其 实 可 以 表示 成 Box<dyn Error>。 下 面 用 这 种 方 
式 来 精简 一 下 file_double 这 个 例子 : 





use std::fs::File; 
use std::io::Read; 
use std::path::Path; 


fn file double<P: AsRef<Path>>(file path: P) -> 
Result<i32, Box<dyn std::error::Error>> { 
let mut file = File::open(file_path)?， 
let mut contents = String: :new(); 
file.read_ to_string(&mut contents)?; 
let n = contents.trim().parse::<i32>()?; 
Ok(2 * n) 
} 


fn main() { 
match file double("foobar") { 
Ok(n) => println!i("{}", Nn), 
Err(err) => println!("Error: {:?}", err), 
} 
} 


二 一 


上 面 这 段 代码 也 可 以 编译 通过 。 因 为 std: : io: : Error 和 std: : 
num: : Parse-Int-Error 类 型 都 实现 了 std: : error: : Errortrait， 都 可 以 
转换 为 Box<dyn std: : error: : Error> 这 个 trait object。 


统一 用 trait object 来 接收 所 有 错误 是 最 简单 的 写法 ， 但 它 也 有 缺 
点 。 最 大 的 问题 是 ， 它 不 方便 问 下 转型 。 如 果 外 面 的 调用 者 希望 针对 某 
些 类 型 做 特殊 的 错误 处 理 ， 就 很 难 办 。 除 非 你 不 需要 对 任何 错误 类 型 做 
任何 有 区 分 的 处 理 。 这 种 写法 适合 一 些 简 单 的 小 工具 。 


使 用 enum 表 达 错 误 类 型 ， 可 以 最 精确 地 表达 错误 信息 。 当 然 带 来 
的 一 个 后 果 是 ， 被 调用 者 的 enum 错 误 类 型 发 生变 化 的 时 候 〈 比 如 给 
enum 增 加 一 个 成 员 ) ， 会 导致 调用 者 那 边 编译 失败 ， 这 是 由 类 型 系统 
保证 的 。 很 多 情况 下 ， 这 其 实 是 设计 者 愿意 看 到 的 结果 ， 改 变 错误 类 型 
本 质 上 就 是 改变 了 API， 此 事 不 该 在 调用 者 完全 不 知情 的 条 件 下 默默 进 
行 。 当 然 ， 有 些 情况 下 设计 者 的 本 意 如 果 就 是 希望 新 增加 一 种 错误 类 型 
但 不 影响 下 游 用 户 的 兼容 性 。 这 也 是 有 办 法 的 ， 那 就 是 最 开始 的 版 本 束 
给 这 个 enum 类 型 加 上 #[non_exhaustive] 标 签 。 这 样 调用 者 那 边 的 代码 在 
做 模式 匹配 的 时 候 ， 无 论 如 何 都 要 写 一 条 默认 分 文 。 以 后 给 enum 新 加 
一 个 成 员 ， 束 不 会 造成 编译 错误 ， 调 用 者 那 边 的 流程 会 执行 最 开始 的 那 
条 默认 分 支 。 具 体 要 不 要 使 用 这 个 标签 ， 束 取决 于 设计 者 的 意图 了 。 




















33.4 ”main 函数 中 使 用 问号 运算 从 


新 加 入 的 问号 运算 符 给 main 函 数 带 来 了 一 个 挑战 。 因 为 问号 运算 符 
会 retumn 一 个 Result 类 型 ， 如 果 它 所 处 的 函数 签名 不 是 返回 的 Result 类 
型 ， 一 定 会 出 现 类 型 匹配 错误 。 而 main 函 数 一 开 始 的 时 候 是 定义 成 
fn() -> () 类 型 的 ， 所 以 问号 运算 符 不 能 在 main 函 数 中 使 用 。 这 显然 
是 一 个 问题 ， 解 决 这 个 问题 的 办 法 就 是 一 一 修改 main 函 数 的 签名 类 型 。 


我 们 和 希望: main 函数 既 可 以 返回 unit 类 型 ， 不 破坏 以 前 的 旧 代 码 ; 
又 可 以 返回 Result 类 型 支持 使 用 问号 运算 符 。 所 以 ， 最 简单 的 办 法 就 
是 使 用 泛 型 ， 兼 容 这 两 种 类 型 。Rust 在 标准 库 中 引入 了 一 个 新 的 trait: 














pub trait Termination { 
/// Is called to get the representation of the value as status code. 
/// This status code is returned to the operating System， 
fn report(self) -> i32; 

} 








main 孙 数 的 签名 就 对 应 地 改 成 了 fn<T: Termination>() ->T。 标 准 
库 为 Result 类 型 、〈() 类 型 、bool 类 型 以 及 发 散 类 型 ! 实现 了 这 个 trait。 
所 以 这 些 类 型 都 可 以 作为 main 函 数 的 返回 类 型 了 。 


它 是 怎么 启动 起 来 的 呢 ?” 是 因为 Runtime 库 中 有 这 样 的 一 个 函数 ， 
它 调 用 了 用 户 写 的 main 函 数 : 








#[lang = "start"] 
fn lang_start<T: ::termination::Termination + 'static> 
(main: fn() -> T, argc: isize, argv: *const *const U8) -> isize 


lang_start_internal(&move || main().report(), argc, argv) 





在 最 终 的 可 执行 代码 中 ， 程 序 刚 局 动 的 时 候 要 先 执行 一 些 Runtime 
目 带 的 逻辑 ， 然 后 才 会 进入 用 户 写 的 main 函 数 中 去 。 


33.5 新 的 Failure 库 


标准 库 中 现存 的 Error trait 有 几 个 明显 问题 : 
.description 方 法 基本 没什么 用 ; 

-无 法 回调， 它 没有 记录 一 层 层 的 错误 传播 的 过 程 ， 不 方便 debug; 
Box<Error> 不 是 线程 安全 的 。 
Failure 这 个 库 就 是 为 了 进一步 优化 错误 处 理 而 设计 的 。 它 主要 包含 


三 个 部 分 。 











:新 的 failure: : Fail trait， 是 为 了 取代 std: : error: : Errortrait 而 
设计 的 。 它 包含 了 更 丰富 的 成 员 方 法 ， 且 继承 于 Send+Sync， 有 具备 线程 
安全 特性 。 

. 目 动 derive 机 制 ， 主 要 是 让 编译 器 帮 用 户 写 一 些 重复 性 的 代码 。 


-failure: : Error 结 构 体 。 所 有 其 他 实现 了 Fail trait 的 错误 类 型 ， 都 
可 以 转换 成 这 个 类 型 ， 而 且 它 提供 了 癌 下 转型 的 方法 。 


使 用 failure 来 实现 前 面 那个 示例 ， 代 码 如 下 : 








#[macro_use] 
extern crate failure; 


use std::fs::File; 
use std::io::Read; 
use std::path::Path; 


#[derive(Debug, Fail)] 

enum MyError { 
#[fail(display = "IO error {}.", _0)] 
Io(#[cause] std::io::Error), 
#[fail(display = "Parse error {}.", _0)] 
Parse(#[cause] std::num::ParseIntError), 


} 


impl From<std::io::Error> for MyError { 
fn from(error: std::io::Error) -> Self { 
MyError::Io(error) 


} 


} 


impl From<std: :num: :ParseIntError> for MyError { 
fn from(error: std::num::ParseIntError) -> Self { 
MyError::Parse(error) 
} 


} 


fn file _ double<P: AsRef<Path>>(file path: P) -> Result<i32, MyError> { 
let mut file = File: :open(file_path)?; 
let mut contents = String: :new(); 
file.read to_string(&mut contents)?; 
let n = contents.trim().parse: :<i32>()?; 
Ok(2 * n) 


fn main() { 
match file double("foobar") { 
Ok(n) => println!i("{}", Nn), 
Err(err) => println!("Error: {:?}", err), 





现在 社区 里 已 经 有 一 些 库 转 向 使 用 failure 做 错误 处 理 。 它 将 来 可 能 
是 Rust 生 态 系 统 中 主流 的 错误 处 理 方 式 。 


第 34 音 FFI 


Rust 有 一 个 非常 好 的 特性 ， 就 是 它 文 持 与 C 语 言 的 ABI 兼 容 。 什 么 
是 ABI 呢 ?维基 百科 是 这 么 解释 的 : 





In computer software, an application binary interface (ABI) is an 
interface between two program modules; often, one of these modules isa 
library or operating system facility, and the other is a program that is being 
run by a user. 


An ABI defines how data structures or computational routines are 
accessed in machine code, which is a low-level, hardware-dependent 
format. 


一 一 Wikipedia 


所 以 ， 我 们 可 以 用 Rust 写 一 个 库 ， 然 后 直接 把 它 当 成 C 写 的 库 来 使 
用 。 或 者 反 过 来 ， 用 C 写 的 库 ， 可 以 直接 在 Rust 中 被 调用 。 而 且 这 个 过 
程 是 没有 额外 性 能 损失 的 。C 语 言 的 ABI 是 这 个 世界 上 最 通用 的 ABI， 大 
部 分 编程 语言 都 文 持 与 C 的 ABI 兼 容 。 这 也 意味 着 ，Rust 与 其 他 语言 之 
间 的 交互 是 没 问 题 的 ， 比 如 用 Rust 为 Python/Node.js/Ruby 写 一 个 模块 
繁 


“wo 

















本 章 主 要 讲解 Rust 如 何 与 其 他 语言 进行 交互 ， 为 了 让 示例 尽 可 能 地 
简洁 、 清 晰 ， 本 章 主要 关注 的 是 Rust 如 何 与 C 语 言 进 行 交互 。 至 于 其 他 
语言 ， 搞 清楚 它们 如 何 与 C 语 言 交 互 就 完全 可 以 掌握 它们 与 Rust 的 交互 
办 法 ， 所 以 无 须 一 个 个 地 分 别 讲解 。 





34.1 什么 是 FFI 


所 谓 的 FFI 指 的 是 : 


A foreign function interface (FFI) is a mechanism by which a program 
written in one programming language can call routines or make use of 
services written in another. 


一 一 Wikipedia 
Rnust 不 文 持 源码 级 别 与 其 他 语言 的 交互 ， 因 为 这 么 做 代价 很 大 、 限 
制 太 多 ， 上 所 以 需要 用 库 的 方式 来 互相 调用 。 这 就 要 求 我 们 有 能 力 用 Rust 


生成 与 C 的 ABI 兼 容 的 库 。 通 过 rustc-h 命 令 我 们 可 以 看 到 ，Rust 编 译 器 支 
持 生 成 这 样 一 些 种 类 的 库 : 





--crate-type [bin|lib|rlibldyliblcdylib|staticlib|proc-macro] 
Comma separated list of types of crates for the 
compiler to emit 








其 中 ，cdylib 和 staticlib 就 是 与 C 的 ABI 兼 容 的 。 分 别 代 表 动 态 链接 库 
和 静态 链接 库 。 在 编译 的 时 候 ， 我 们 需要 指定 这 样 的 选项 才能 生成 合适 
的 目标 文件 。 指 定 目 标 文件 类 型 有 两 种 方式 : 





:在 编译 命令 行 中 指定 ， 如 rustc--crate-type=staticlib test.rs; 
:在 源 代码 入 口中 指定 ， 如 #1! [crate_type="staticlib"]。 
另外 ， 我 们 还 需要 注意 ，C 的 ABI 以 及 运行 时 库 也 不 是 完全 统一 


的 。 此 事 是 由 rustup 工 具 管 理 的 。 执 行 rustup show 可 以 看 到 当前 使 用 的 
工具 链 是 什么 ， 比 如 笔者 当前 的 工具 链 是 : 








Default host: x86_64-unknown-linux-gnu 





这 意味 着 用 这 人 套 工 具 链 生成 的 C 库 是 和 gcc 工 具 链 的 ABI 羔 容 的 。 如 
果 读 者 需要 生成 与 MSVC 的 ABI 兼 容 的 库 ， 那 么 需要 使 用 : 


rustup target add x86_ 64-pc-windows-msvc 





我 们 还 可 以 用 rustup 来 下 载 Android 系 统 的 工具 链 ， 实 现 交 叉 编 译 ， 
等 等 。 关 于 工具 链 以 及 C 运 行 时 库 的 链接 方式 的 问题 ， 读 者 可 以 参考 
rustup 的 官方 网 站 。 





除了 指定 目标 文件 、 工 具 链 之 外 ， 更 重要 的 是 需要 注意 接口 的 设 
计 。 不 是 所 有 的 Rust 的 语言 特性 都 适合 放 到 交互 接口 中 的 。 比 如 ，Rust 
中 有 泛 型 ，C 语 言 里 面 没 有 ， 所 以 泛 型 这 种 东西 是 不 可 能 暴露 出 来 给 C 
语言 使 用 的 ， 这 就 不 是 C 语 言 的 ABI 的 一 部 分 。 只 有 符合 C 语 言 的 调用 方 
式 的 函数 ， 才 能 作为 FFI 的 接口 。 这 样 的 函数 有 以 下 基本 要 求 : 

:使 用 extern"C" 修 饰 ， 在 Rust 中 extern fn 默认 等 同 于 extern"C"fn; 

-使 用 #[no_mangle] 修 饰 函 数 ， 避 人 免 名 字 重 整 ， 


函数 参数 、 返 回 值 中 使 用 的 类 型 ， 必 须 在 Rust 和 C 里 面具 备 同 样 的 
内 存 布局 。 


下 面 我 们 用 示例 来 说 明 如 何 实现 FFI。 








34.2 ”从 C 调 用 Rust 库 


假设 我 们 要 在 Rust 中 实现 一 个 把 字符 串 从 小 写 变 大 写 的 函数 ， 然 后 
由 C 语 言 调用 这 个 函数 。 实 现代 码 如 下 : 





#[no_manglej] 
pub extern "C" fn rust_capitalize(s: *mut c_char) 


unsafe { 
let mut p= s as *mut u8; 
while *p != © { 
let ch = char::from(*p); 
If ch.is ascii() { 
let upper = ch.to ascii uppercase(); 
*p = upper as u8; 
} 
p = p.offset(1); 
} 
} 
} 





我 们 在 Rust 中 实现 这 个 函数 ， 考 虑 到 C 语 言 调用 的 时 候 传递 的 是 
char* 类 型 ， 所 以 在 Rust 中 我 们 对 应 的 参数 类 型 是 *mut std: : os: : 
raw: : Cc_char。 这 样 两 边 就 对 应 起 来 了 。 


这 个 函数 是 要 被 外 部 的 C 代 码 调 用 的 ， 所 以 一 定 要 用 extern"C" 修 
饰 。 用 #[no_mangle] 修 饰 主要 是 为 了 保证 导出 的 函数 名 字 和 源码 中 的 一 
致 。 这 个 并 不 是 必须 的 ， 我 们 还 可 以 使 用 # 
[export_name="my_whatever_name'"] 来 指定 导出 名 字 。 在 某 些 时 候 ， 我 
们 需要 导出 的 函数 名 恰好 在 Rust 中 跟 某 个 关键 字 发 生 了 冲突 ， 就 可 以 用 
这 种 方式 来 规避 


使 用 如 下 编译 命令 ， 可 以 生成 一 个 与 C 的 ABI 兼 容 的 静态 库 

















rustc --crate-type=staticlib capitalize.rs 





下 面 我 们 再 写 一 个 调用 这 个 函数 的 C 程 序 : 





#include <stdlib.h> 
#include <stdio.h> 


// declare 
extern void rust_ capitalize(char *); 


int main() { 
char str[] = "hello world",; 
rust_capitalize(str); 
printf("%s\n", str); 
return ©; 





使 用 如 下 命令 编译 链接 : 





gcc -0o main main.c -L. -1l:libcapitalize.a -Wl,--gc-sections -lpthread -ldl 














可 以 正确 生成 可 执行 程序 。 执 行 代码 ， 可 见 该 程序 完成 了 预期 中 的 
功能 。 


34.3 ”从 Rust 调 用 C 库 


这 个 例子 我 们 反 过 来 ， 从 Rust 中 调用 C 写 的 库 。C 的 实现 如 下 所 示 : 





int add square(int a, int b) 


return a*a+b™* b; 


} 





使 用 如 下 命令 可 以 生成 对 应 的 静态 库 : 





gcc -c -Wall -werror -fpic simple math.c 
ar rcs libsimple math.a simple_math.o 





现在 我 们 到 Rust 中 调用 这 个 静态 库 : 





use std::os::raw::c_int; 


#[link(name = "simple_ math")] 
extern "C" { 
fn add_square(a: c_int, b: c_int) -> c_int; 


fn main() { 
let r = unsafe { add_square(2, 2) }; 
printin!("{}", r); 





使 用 如 下 命令 编译 链接 : 





rustc -L . call math.rs 





参数 - 工 可 以 指定 依赖 库 的 查找 路 径 ， 具 体 的 名 字 可 以 通过 # 
[link (name="]ibrary_name") ] 来 指定 。 


34.4 更 复杂 的 数据 类 型 


对 于 交互 接口 中 的 简单 类 型 ， 我 们 直接 使 用 标准 库 中 定义 好 的 
std: : 0s: : raw 里 面 的 类 型 就 够 了 。 而 更 复杂 的 类 型 就 需要 我 们 手动 
封装 了 。 比 如 结构 体 就 需要 用 大 repr 〈C) ] 修 饰 ， 以 保证 这 个 结构 体 在 
Rust 和 C 双 方 的 内 存 布局 是 一 致 的 。 


如 采 我 们 需要 做 的 是 跟 常 见 的 操作 系统 交互， 许多 和 凋 用 的 数据 结构 
都 已 经 有 人 封装 好 了 ， 可 以 在 crates.io 找 libc 库 直接 使 用 。 接 下 来 我 们 用 
一 个 示例 演示 一 下 在 接口 中 包含 结构 体 该 怎样 做 。 这 个 示例 同时 也 使 用 
J 了 cargo 来 管理 Rust 项 目 ， 且 使 用 动态 链接 库 的 方式 执行 。 


Rust 项 目 Cargo.toml 如 下 所 示 : 














[package] 

name = "log" 
version = "0.1.0" 
authors = ["F001"] 


[dependencies] 
libc = "0.2" 
[1ib] 


name = "rust_log" 
crate-type = ["cdylib"] 





src/lib.rs 文 件 内 容 如 下 所 示 : 





#![crate_ type = "cdylib"] 
extern crate libc; 


use libc::{c_int, c_char}; 
use std::ffi::CStr,; 


// this struct is used as an public interface 
#[repr(C)] 
#[no_manglel] 
pub struct RustLogMessage { 
id: c_int, 
msg: *const c_char 


} 


#[no_mangle] 
pub extern "C" fn rust_log(msg: RustLogMessage) { 


let s = unsafe { CStr::from ptr(msg.msg) }; 
println!("id:{} message:{:?}", msg.id, s); 








使 用 cargo build 就 可 以 编译 出 对 应 的 动态 库 。 
C 语 言 的 调用 代码 如 下 所 示 : 





#include <stdio.h> 
#include <stdlib.h> 
#include <dlfcn.h> 
struct RustLogMessage { 
int id; 
char *msg; 


}; 


int main() 


{ 


void *rust log lib; 
void (*rust_log_fn)(struct RustLogMessage msg); 


rust_log_lib = dlopen("./rust_ log/target/debug/librust_ log.so", RTLD_LAZY); 
If ( rust 1og_ lib != NULL ) { 

rust_log_fn = dlsym(rust_ 1og_ lib, "rust_ lo0g"); 
} else { 

printf("load so library failed.\n"); 

return 1; 


} 


for (int i = 0; i < 10; i++) { 
struct RustLogMessage msg = { 
id :1, 
msg : "string in C\n", 
}; 
rust_log_fn(msg); 
} 


if (rust_log lib != NULL ) dlclose(rust_ log 1ib); 


return EXIT_SUCCESS,; 








编译 命令 为 gcc main.c-ldl。 执 行程 序 之 前 ， 要 保证 动态 链接 库 和 可 
执行 程序 之 间 的 相对 路 径 关 系 是 正确 的 ， 然 后 执行 。 可 见 ， 参 数 正 确 地 
在 Rust 和 C 之 间 传 递 了 。 


第 35 章 ”文档 和 测试 
35.1 文档 


Rust 也 文 持 使 用 注释 来 编写 规范 的 文档 。 可 以 使 用 rustdoc 工 具 把 源 
码 中 的 文档 提取 出 来 ， 生 成 易 读 的 HTML 等 格式 。 在 cargo 里 面 可 以 用 
cargo doc 命 令 生 成 文档 。 


普通 的 注释 有 两 种 ， 一 种 是 用 /开头 的 ， 是 行 注释 ， 一 种 是 /**/， 是 
块 注释 。 这 些 注释 不 会 被 视 为 文档 的 一 部 分 。 特 殊 的 文档 注释 
是 1//、W! 、/A#...*/、/#1 ...*/， 它 们 会 被 视 为 文档 。 

跟 attribute 的 规则 类 似 : 用 开头 的 文档 被 视 为 是 给 它 后 面 的 那个 元 


素 做 的 说 明 ; /! 开头 的 文档 被 视 为 是 给 包含 这 坎 文 档 的 元 素 做 的 说 
明 。/*#*...*/ 和 /*! ...#/ 也 是 类 似 的 。 示 例如 下 : 








mod foo { 
//! 这 块 文档 是 给 “foo” 模块 做 的 说 明 





/// 这 块 文档 是 给 函数 “`f” 做 的 说 明 
fn f() { 

// 这 块 注释 不 是 文档 的 一 部 分 

} 











文档 内 部 文 持 markdown 格 式 。 可 以 使 用 # 作 为 一 级 标题 。 比 如 标准 
库 中 向 用 的 几 种 标题 : 





/// # Panics 
/// # Errors 
/// # Safety 
/// # Examples 





ee 代码 块 应 该 用 ` 括 起 
有 来。 比如 : 





/// ~ 
/// let mut vec = Vec::with capacity(10); 


/// 

/// // The vector contains no items, even though it has capacity for more 
/// assert_eq!(vec.len(), 0); 

/// ~ 





Rust 文 档 里 面 的 代码 块 ， 在 使 用 cargo test 命 令 时 ， 也 是 会 被 当做 测 
试用 例 执行 的 。 这 个 设计 可 以 在 很 多 时 候 检 查 出 文档 和 代码 不 对 应 的 情 
况 。 


如 果 文 档 太 长 ， 也 可 以 写 在 单独 的 markdown 文 件 中 。 如 果 在 单独 
的 文件 中 写 文档 ， 就 不 需要 再 用 /// 或 者 //! 开头 了 ， 直 接 写 内 容 就 可 
以 。 然 后 再 用 一 个 attribute 来 指定 给 对 应 的 元 素 : 








#![feature(external doc)] 


#[doc(include = "external-doc.md")] 
pub struct MyAwesomeType; 





35.2 ”测试 


Rust 内 置 了 一 套 单元 测试 框架 。 单 元 测试 是 一 种 目前 业界 广泛 使 用 
的 ， 可 以 显著 提升 代码 可 靠 性 的 工程 管理 手段 。Rust 里 面 的 单元 测试 代 
人 码 可 以 直接 和 业务 代码 写 在 一 个 文件 中 ， 非 常 有 利于 管理 ， 方 便 更 新 。 
执行 单元 测试 也 非常 简单 ， 一 条 cargo test 命 令 即 可 。 


一 般 情况 下 ， 如 果 我 们 新 建 一 个 library 项 目 ，cargo 工 具 会 帮 有 我 们 在 
src/lib.rs 中 自动 生成 如 下 代 伍 : 














#[cfg(test)] 

mod tests { 
#[test] 
fn it works() { 
} 





这 就 是 最 基本 的 单元 测试 框架 。 下 面 详细 介绍 一 下 这 里 面 的 各 个 要 
首先 ，Rust 里 面 有 一 个 特殊 的 attribute， 叫 作 #[cfg]。 它 主要 是 用 于 


实现 各 种 条 件 编译 。 比 如 #[cfg (test〉] 意 思 是 ， 这 部 分 代码 只 在 test 这 
个 开关 打开 的 时 候 才 会 被 编译 。 它 还 有 更 高 级 的 用 法 ， 比 如 








#[cfg(any(unix, windows))] 
#[cfg(all(unix, target_pointer_width = "32"))] 


#[cfg(not(foo))] 
#[cfg(any(not(unix), all(target_ os="macos", target arch = "powerpc")))] 





我 们 还 可 以 自 定 义 一 些 功 能 开关 。 比 如 在 Cargo.toml 中 加 入 这 样 的 
代码 : 





[features] 
# 默认 开启 的 功能 开关 
default = [] 


























# 定义 一 个 新 的 功能 开关 , 以 及 它 所 依赖 的 其 他 功能 
# 我 们 定义 的 这 个 功能 不 依赖 其 他 功能 , 默认 没有 开启 

















my_feature_name = [] 





之 后 就 可 以 在 代码 中 使 用 这 个 功能 开关 ， 某 部 分 代码 可 以 根据 这 个 
开关 的 状态 决定 编译 还 是 不 编译 : 











#[cfg(feature = "my feature_name")] 
mod sub_module name { 
} 





这 个 开关 究竟 是 开 还 是 关 ， 可 以 通过 编译 选项 传递 进去 : 





cargo build --features "my_feature_name” 





当 我 们 使 用 cargo test 命 令 的 时 候 ， 被 #[cfg 〈test) ] 标 记 的 代码 就 会 
被 编译 执行 ， 否 则 直接 被 忽略 。 


我 们 还 是 用 一 个 示例 来 说 明 。 我 们 现在 准备 实现 一 个 轧 转 相 除 法 求 
最 大 公约 数 的 功能 。 新 建 一 个 名 叫 gcd 的 项 目 : 








cargo new --1lib gcd 








轧 转 相 除法 的 细 市 束 不 展开 了 。 实 现代 码 如 下 所 示 : 





pub fn gcd(a: u64, b: u64) -> u64 
t 


let (mut 1, mut g) = if a< bf{ 


(a, b) 
} else { 

(b, a) 
}; 


while 1 != 0 { 
let m= g%1; 
1; 
证 











接 下 来 添加 一 个 最 基本 的 训 试 : 


[Ee | 


#[cfg(test)] 
mod tests { 
#[test] 
fn it works() { 
assert_ eq!(gcd(2, 3), 1); 
} 


} 








使 用 cargo test 命 令 执 行 这 个 测试 。 这 一 次 发 生 了 编译 错误 ， 编 译 器 
找 不 到 gcd 这 个 函数 。 这 是 因为 我 们 把 测试 用 例 写 在 了 一 个 单独 的 模块 
中 ， 在 子 模块 中 并 不 能 直接 访问 父 模块 中 的 内 容 。 在 mod 内 部 加 一 句 use 
gcd; 或 者 use super: : *; 可 以 解决 这 个 问题 。 





Compiling gcd vO.1.0 (file:///projects/gcd) 
Finished dev [unoptimized + debuginfo] target(s) in 2.33 secs 
Running target/debug/deps/gcd-1658b34b1lide16a01 


running 1 test 
test tests::it works ... ok 


test result: ok. 1 passed; 0 failed; 0 ignored; © measured; 0 filtered out 
Doc-tests gcd 
running 9 tests 


test result: ok. © passed; 0 failed; 0 ignored; 0 measured; 0 filtered out 








打印 出 来 的 结果 非常 清晰 易 读 。 前 面 一 部 分 是 执行 测试 模块 中 的 测 
试用 例 的 结果 ， 后 面 一 部 分 是 执行 文档 中 的 测试 用 例 的 结果 。1 passed 
代表 通过 了 1 个 测试 。0 failed 代 表 失 败 了 0 个 测试 。0 ignored 代 表 和 忽略 了 
0 个 测试 。 


用 户 可 以 用 #[ignore] 标 记 测 试用 例 ， 暂 时 忽略 这 个 测试 。 比 如 : 





#[test] 
#[ignore] 
fn it works() { 
assert_ eq!(gcd(2, 3), 1); 
} 





0 measured 代 表 跑 了 0 个 benchmark 性 能 测试 。 我 们 可 以 用 #[bench] 添 
加 性 能 测试 用 例 : 





#[cfg(test)] 
mod tests { 
USe super::*,; 
use self::test::Bencher,; 


#[bench] 
fn big_num(b: &mut Bencher) { 
b.iter(|| gcd(12345, 67890) ) 
} 
} 





这 个 功能 目前 还 没有 稳定 ， 需 要 用 户 在 当前 crate 中 开局 feature 
gate : 





#![feature(test)] 
extern crate test; 





然后 使 用 cargo bench 就 可 以 执行 这 个 性 能 测试 。 这 时 就 可 以 看 到 测 
试 结 果 中 有 1 measured 的 结果 。 


测试 结果 中 还 有 0 filtered out 统 计数 据 。 这 个 数据 代表 的 是 用 户 跑 测 
试 的 时 候 过 滤 出 来 了 多 少 测试 用 例 。 比 如 我 们 有 许多 测试 用 例 ， 但 是 只 
想 执 行 某 一 个 具体 的 测试 用 例 it_works， 可 以 这 样 做 : cargo test 
it_works。 或 者 可 以 用 开头 几 个 字母 过 滤 出 多 个 测试 用 例 ， 比 如 cargo 
test it。 还 有 更 多 的 用 法 可 以 参见 cargo test-h。 


在 测试 用 例 内 部 ， 我 们 一 般 用 assert_eq! 宏 来 检查 真实 结果 和 预期 
结果 是 人 否 一 致 。 除 此 之 外 ， 也 还 有 其 他 的 检查 方法 。assert! 宏 可 以 用 
于 检查 一 个 bool 关 型 吉 果 是 否 为 true。assert_nel! 宏 可 以 用 于 检查 两 个 数 
据 是 否 不 相等 。 男 外 ， 我 们 还 可 以 在 这 些 宏 里 面 自 定 义 错误 信息 。 比 如 
我 们 用 0 来 测试 上 面 这 个 gcd 函 数 。 因 为 0 作为 除数 没有 意义 ， 所 以 我 们 
I 输出 结果 都 是 0， 可 以 写 这 样 的 测试 用 
列 : 




















#[test] 
fn with_zero() { 

assert_ eq!(gcd(10, 0), 909, "division by zero has no meaning"); 
} 








如 果 测 试 失败 ， 失 败 消 旦 中 会 显示 我 们 指定 的 那 条 信 


另外 ， 有 些 时 候 测试 结果 无 法 用 “等 于 不 等 于 "这 种 条 件 表达 ， 比 如 
发 生 panic。 测 试 框架 也 允许 我 们 用 新 should_panic] 做 这 种 测试 。 假 设 ， 
我 们 修改 一 下 上 面 的 gcd 函 数 的 逻辑 ， 不 允许 参数 为 0%， 如 果 参 数 是 0 直 
接 发 生 panic: 


pub fn gcd(a: u64, b: u64) -> u64 
{ 


if a ==0 || b==0 
panic!("Parameter should not be zero"); 


为 了 测试 这 种 情况 ， 我 们 可 以 写 如 下 测试 用 例 : 





#[test] 

#[should_panic] 

fn with_ zero() { 
gcd(10, 0); 





一 般 我 们 都 把 测试 用 例 放 到 单独 的 mod 里 面 ， 打 上 #[cfg (test) ] 条 
件 编译 的 标签 ， 这 样 编译 正常 代码 的 时 候 就 可 以 把 测试 相关 的 整个 模块 
忽略 掉 。 这 个 测试 模块 一 般 直接 放 在 被 测试 代码 的 同一 个 文件 中 : 一 方 
面 是 比较 直观 容易 管理 ， 另 一 方面 ， 根 据 Rust 的 模块 可 见 性 规则 ， 这 个 
测试 模块 有 权 访问 它 父 模块 的 私有 元 素 ， 这 样 比较 方便 测试 。 


用 尸 也 可 以 自己 组 织 测 试用 例 的 代码 结构 。 比 如 单独 使 用 一 个 新 的 
文件 夹 来 管理 测试 用 例 ， 这 都 是 没 问 题 的 。 毕 葛 测 试 代码 也 不 过 就 是 一 
个 普通 的 模块 而 已 ， 我 们 可 以 自由 选择 如 何 管理 这 个 模块 。 








附录 ”词汇 表 


ABI 

Alias 

Arc 

Associated Item 
Atomic 
Attribute 
Borrow Check 
Box 

Cargo 

Closure 
Compile Unit 
Constructor 
Copy 

Crate 

Data Race 
Deref 
Destructor 
Destructure 
diverge function 
DS8T 

Dynamic Trait Type 
Fat Pointer 
Feature Gate 
FFI 


Application Binary Interface 


别名 


Atomic Reference Counter 


关联 条 目 ， 包 括 关 联 类 型 、 关 联 方 法 、 关 联 常 量 等 


原子 的 


属性 ， 在 Rust 中 跟 宏 性 质 是 一 样 的 东西 ， 


借用 检查 

具有 所 有 权 的 智能 指针 
Rust 的 官方 包 管理 工具 
闭 包 

编译 单元 

构造 器 


特殊 trait， 代 表 类 型 默认 是 复制 语义 


Rust 的 基本 编译 单元 
数据 苋 

解 引用 

析 构 函数 

解构 


发 散 函数 ， 永 远 不 会 返回 的 函数 
Dynamic Sized Type 编译 阶段 无 法 确定 大 小 的 类 型 


Trait Object 的 新 名 字 
胖 指 针 ， 即 还 携带 额外 信 
功能 开关 


Foreign Function Interface 


息 的 指针 


语法 外 观 不 同 


Fn/FnMut/FnOnce 


Generic 


Higher Rank Lifetime 
Higher Rank Trait Bounds 
Higher Rank Type 


ICE 


inherited mutability 
Interior Mutability 


intrinsics 
lterator 
Lifetime 
Lifetime Elision 
Lint 

LLVM 

Macro 
Memory Safe 
MIR 

Module 

Move 
Mutability 
NLL 

Object Safe 
OIBIT 
Orphan Rules 
Ownership 
Panic 

Pattern Match 


Placement New 
Playpen 


POD 

Prelude 

Race Condition 
RAT 

Re 

Release Channel 
RFC 

Rustc 

RVO 


( 续 ) 

闭 包 相关 的 系列 trait 

高 阶 生命 周期 

高 阶 trait 约束 

高 阶 类 型 系统 

Intemal Compiler Error 编译 器 内 部 错误 

承 玉 可 变性 

内 部 可 变性 

编译 器 内 置 函数 

迁 代 带 

生命 周期 

生命 周期 省 略 

可 自 定 义 扩展 的 编译 阶段 检查 

Low Level Virtual Machine 

宏 

内 存 安全 ，Rust 的 内 存 安全 主要 指 没有 段 错误 Segmentation fault 

Middle-level IR 

模块 

移动 

可 变性 

Non Lexical Lifetime， 非 词法 生命 周期 

能 正确 构造 trait object 的 规则 

opt-in builtin traits， 新 名 字 为 Auto trait 

孤儿 规则 

所 有 权 

恐 慌 ， 在 Rust 中 用 于 不 可 恢复 错误 处 理 

模式 匹配 

在 用 户 指定 的 内 存 位 置 上 构建 新 的 对 象 

指 的 是 http://play.rust-lang.org 网 站 。 这 个 网 站 提供 了 方便 的 编写 、 编 译 、 
执行 Rust 代码 的 能 力 

Plain Old Data 

预先 声明 的 自动 被 包含 到 每 个 源码 中 的 内 容 

况 态 条 件 

Resource Acquisition Is Initialization 是 C++ 等 编程 语言 常用 的 管理 资源 方法 

Reterence Counted 引用 计数 智能 指针 

发 布 渠 道 

Request For Comments 语言 设计 提案 ，FCP 指 Final Comment Period 

Rust 官方 编译 器 的 可 执行 文件 名 字 


Return Value Optimization 


Self/self 

Send 
Shadowing 
SIMD 

Sized 

Slice 
Specialization 
Stack Unwind 
SITE 

Sync 

TLS 

Toml 

Trait Object 
TWiR 


Type Inference 
UFCS 


Unit Type 
Unsized Type 
VTable 

ZST 


( 续 ) 
小 写 s 是 特殊 变量 ， 大 写 S 是 特殊 类 型 
特殊 的 trait， 代 表 变 量 可 以 跨 线程 转移 所 有 权 
遮 项 ,变量 允许 遮蔽 ， 类 型 和 生命 周期 不 允许 
Single Instruction Multiple Data 单 指令 多 数据 流 
特殊 的 trait， 代 表 编 译 阶段 类 型 的 大 小 是 已 知 的 
数组 切片 
泛 型 特 化 
栈 展开 
standard template library 是 C++ 的 标准 模板 库 
特殊 trait， 代 表 变 量 可 以 跨 线 程 共享 
Thread Local Storage 线程 局 部 存储 
一 种 文本 文件 格式 
指向 对 象 及 其 虚 表 的 胖 指 针 ， 以 后 会 改名 为 dynamic trait type 
This Week in Rust， 一 个 很 有 信息 量 的 网 站 
类 型 自动 推导 
Universal Function Call Syntax, 通用 函数 调用 语法 ， 
后 来 改 为 Fully Qualified Syntax 
单元 类 型 ， 即 空 tuple， 记 为 () 
不 满足 Sized 约束 的 类 型 
零 大 小 数据 类 型 


